ray.rllib.policy.torch_policy_v2.TorchPolicyV2.get_tower_统计#
- TorchPolicyV2.get_tower_stats(stats_name: str) List[numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor | dict | tuple] [源代码]#
返回每个塔的统计列表,复制到此策略的设备中。
- 参数:
stats_name – 要平均的统计数据的名称(此字符串必须作为每个塔的
tower_stats
字典中的一个键存在)。- 返回:
所有塔的统计张量(结构体)列表,复制到此策略的设备上。
- 抛出:
AssertionError – 如果在任何一座塔的
tower_stats
字典中找不到stats_name
。