ray.rllib.core.rl_模块.rl_模块.RL模块.输出规格_探索#

RLModule.output_specs_exploration() List[str | Tuple[str, ...]][源代码]#

返回 forward_exploration() 方法的输出规格。

重写此方法以自定义探索调用的输出规格。默认实现要求 forward_exploration() 方法返回一个包含 action_dist 键的字典,其值是 Distribution 的一个实例。