ray.rllib.policy.torch_policy_v2.TorchPolicyV2.get_tower_统计#

TorchPolicyV2.get_tower_stats(stats_name: str) List[numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor | dict | tuple][源代码]#

返回每个塔的统计列表,复制到此策略的设备中。

参数:

stats_name – 要平均的统计数据的名称(此字符串必须作为每个塔的 tower_stats 字典中的一个键存在)。

返回:

所有塔的统计张量(结构体)列表,复制到此策略的设备上。

抛出:

AssertionError – 如果在任何一座塔的 tower_stats 字典中找不到 stats_name