ray.rllib.algorithms.algorithm_config.AlgorithmConfig.build_learner_group#

基于 self 中的设置构建并返回一个新的 LearnerGroup 对象。

参数:

env – 一个可选的 EnvType 对象（例如 gym.Env），用于提取空间信息，以便在 LearnerGroup 的学习者工作线程中构建 RLModule。请注意，如果 RLlib 无法从 env 参数、可选的 spaces 参数或 self 中推断出任何空间信息，则无法创建 LearnerGroup。
spaces – 一个可选的字典，将模块ID映射到（观察空间，动作空间）元组，用于在LearnerGroup的学习者工作线程中构建的RLModule。请注意，如果RLlib无法从`spces`参数、可选的`env`参数或`self`中推断出任何空间信息，则无法创建LearnerGroup。
rl_module_spec – 一个可选的（单智能体或多智能体）RLModuleSpec，用于构建LearnerGroup。如果为None，RLlib将尝试使用此`AlgorithmConfig`对象中提供的其他信息和存储的信息来推断RLModuleSpec。

返回:

新创建的 LearnerGroup 对象。