Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.core.rl_模块.rl_模块.RL模块.前向推理#

RLModule.forward_inference(batch: SampleBatch | MultiAgentBatch | Dict[str, Any], **kwargs) → Dict[str, Any][源代码]#

在评估期间的前向传递，从采样器调用。

不应重写此方法以实现自定义前向推理方法。相反，应重写 _forward_inference 方法。

参数:

batch – 输入批次。此输入批次应符合 input_specs_inference() 的要求。
**kwargs – 附加的关键字参数。

返回:

前向传播的输出。该输出应符合 ouptut_specs_inference() 的要求。

优云智算