ray.rllib.core.rl_模块.rl_模块.RL模块.前向探索#
- RLModule.forward_exploration(batch: SampleBatch | MultiAgentBatch | Dict[str, Any], **kwargs) Dict[str, Any] [源代码]#
探索期间的正向传递,从采样器调用。
不应重写此方法以实现自定义的前向探索方法。相反,应重写 _forward_exploration 方法。
- 参数:
batch – 输入批次。此输入批次应符合 input_specs_exploration()。
**kwargs – 附加的关键字参数。
- 返回:
前向传播的输出。此输出应符合 output_specs_exploration() 的要求。