ray.rllib.utils.exploration.random_encoder.RE3.postprocess_trajectory# RE3.postprocess_trajectory(policy, sample_batch, tf_sess=None)[源代码]# 计算状态的潜在表示/嵌入。 嵌入被添加到 SampleBatch 对象中,这样在每次训练步骤中就不需要重新计算。