ray.rllib.algorithms.algorithm_config.AlgorithmConfig.build_learner_group#
- AlgorithmConfig.build_learner_group(*, env: Any | gymnasium.Env | None = None, spaces: Dict[str, Tuple[gymnasium.Space, gymnasium.Space]] | None = None, rl_module_spec: RLModuleSpec | MultiRLModuleSpec | None = None) LearnerGroup [源代码]#
基于
self
中的设置构建并返回一个新的 LearnerGroup 对象。- 参数:
env – 一个可选的 EnvType 对象(例如 gym.Env),用于提取空间信息,以便在 LearnerGroup 的学习者工作线程中构建 RLModule。请注意,如果 RLlib 无法从
env
参数、可选的spaces
参数或self
中推断出任何空间信息,则无法创建 LearnerGroup。spaces – 一个可选的字典,将模块ID映射到(观察空间,动作空间)元组,用于在LearnerGroup的学习者工作线程中构建的RLModule。请注意,如果RLlib无法从`spces`参数、可选的`env`参数或`self`中推断出任何空间信息,则无法创建LearnerGroup。
rl_module_spec – 一个可选的(单智能体或多智能体)RLModuleSpec,用于构建LearnerGroup。如果为None,RLlib将尝试使用此`AlgorithmConfig`对象中提供的其他信息和存储的信息来推断RLModuleSpec。
- 返回:
新创建的
LearnerGroup
对象。