ray.rllib.policy.eager_tf_policy_v2.EagerTFPolicyV2.stats_fn#

EagerTFPolicyV2.stats_fn(train_batch: SampleBatch) Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor][源代码]#

统计函数。返回一个统计数据的字典。

参数:

train_batch – 用于训练的 SampleBatch(已使用)。

返回:

统计字典。