ray.rllib.core.learner.learner.Learner.为模块配置优化器#

abstract Learner.configure_optimizers_for_module(module_id: str, config: AlgorithmConfig = None) None[源代码]#

为给定的 module_id 配置一个优化器。

此方法在 Learner 训练 MultiRLModule 中的每个 RLModule 时调用,以及在训练期间通过 self.add_module() 添加的任何新模块时调用。它应配置并构建一个或多个优化器,并通过调用 self.register_optimizer() 以及 module_id、可选的优化器名称(字符串)、优化器的框架特定参数(变量)列表和可选的学习率值或 -schedule 来注册它们。

参数:
  • module_id – 正在配置的 RLModule 的 module_id。

  • config – 特定于给定 module_id 的 AlgorithmConfig。