Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.utils.exploration.random_encoder.RE3.postprocess_trajectory#

RE3.postprocess_trajectory(policy, sample_batch, tf_sess=None)[源代码]#

计算状态的潜在表示/嵌入。

嵌入被添加到 SampleBatch 对象中，这样在每次训练步骤中就不需要重新计算。