ray.rllib.policy.torch_policy_v2.TorchPolicyV2.额外计算梯度获取#

TorchPolicyV2.extra_compute_grad_fetches() Dict[str, Any][源代码]#

从 compute_gradients() 中获取并返回的额外值。

返回:

要添加到 compute_gradients 调用的 fetch 字典中的额外 fetch 字典。