ray.rllib.core.rl_模块.rl_模块.RL模块配置#

class ray.rllib.core.rl_module.rl_module.RLModuleConfig(observation_space: gymnasium.Space = None, action_space: gymnasium.Space = None, inference_only: bool = False, learner_only: bool = False, model_config_dict: ~typing.Dict[str, ~typing.Any] = <factory>, catalog_class: ~typing.Type[Catalog] = None)[源代码]#

基类:object

一个实用配置类,用于简化RLModules的构建。

参数:
  • observation_space – RLModule 的观察空间。这可能与环境的观察空间不同。例如,环境的离散观察空间通常对应于 RLModule 的 one-hot 编码观察空间,这是由于预处理的原因。

  • action_space – RLModule 的动作空间。

  • inference_only – RLModule 是否应在其仅推理状态下配置,其中那些不需要用于动作计算的组件(例如价值函数或目标网络)可能会缺失。请注意,inference_only=Truelearner_only=True 是不允许的。

  • learner_only – 这个 RLModule 是否应该仅在 Learner 工作节点上构建,而不是在 EnvRunners 上。对于仅用于训练的多 RLModule 内部的 RLModule 非常有用,例如多智能体设置中的共享价值函数或好奇心学习设置中的世界模型。请注意,inference_only=Truelearner_only=True 是不允许的。

  • model_config_dict – 要使用的模型配置字典。

  • catalog_class – 要使用的目录类。

方法

from_dict

从序列化表示创建一个配置。

get_catalog

返回此配置的目录。

to_dict

返回配置的序列化表示。

属性

action_space

catalog_class

inference_only

learner_only

observation_space

model_config_dict