ray.rllib.policy.torch_policy_v2.TorchPolicyV2.on_global_var_update# TorchPolicyV2.on_global_var_update(global_vars: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor]) → None# 在全局变量更新时调用。 参数: global_vars – 按字符串键广播的全局变量,从驱动程序发出。