ray.rllib.算法.算法配置.AlgorithmConfig.构建学习器#
- AlgorithmConfig.build_learner(*, env: Any | gymnasium.Env | None = None, spaces: Dict[str, Tuple[gymnasium.Space, gymnasium.Space]] | None = None) Learner [源代码]#
基于
self
中的设置构建并返回一个新的 Learner 对象。这个 Learner 对象将已经调用了其
build()
方法,这意味着其 RLModule 已经构建完成。- 参数:
env – 一个可选的 EnvType 对象(例如 gym.Env),用于提取空间信息,以便在 Learner 内部构建 RLModule。请注意,如果 RLlib 无法从
env
参数、可选的spaces
参数或self
中推断出任何空间信息,则无法创建 Learner。spaces – 一个可选的字典,将ModuleIDs映射到(观察空间,动作空间)元组,用于在Learner内部构建的RLModule。请注意,如果RLlib无法从`spces`参数、可选的`env`参数或`self`中推断出任何空间信息,则无法创建Learner。
- 返回:
新创建(且已构建)的 Learner 对象。