ray.rllib.algorithms.algorithm_config.AlgorithmConfig.build_learner_group#

AlgorithmConfig.build_learner_group(*, env: Any | gymnasium.Env | None = None, spaces: Dict[str, Tuple[gymnasium.Space, gymnasium.Space]] | None = None, rl_module_spec: RLModuleSpec | MultiRLModuleSpec | None = None) LearnerGroup[源代码]#

基于 self 中的设置构建并返回一个新的 LearnerGroup 对象。

参数:
  • env – 一个可选的 EnvType 对象(例如 gym.Env),用于提取空间信息,以便在 LearnerGroup 的学习者工作线程中构建 RLModule。请注意,如果 RLlib 无法从 env 参数、可选的 spaces 参数或 self 中推断出任何空间信息,则无法创建 LearnerGroup。

  • spaces – 一个可选的字典,将模块ID映射到(观察空间,动作空间)元组,用于在LearnerGroup的学习者工作线程中构建的RLModule。请注意,如果RLlib无法从`spces`参数、可选的`env`参数或`self`中推断出任何空间信息,则无法创建LearnerGroup。

  • rl_module_spec – 一个可选的(单智能体或多智能体)RLModuleSpec,用于构建LearnerGroup。如果为None,RLlib将尝试使用此`AlgorithmConfig`对象中提供的其他信息和存储的信息来推断RLModuleSpec。

返回:

新创建的 LearnerGroup 对象。