ray.rllib.policy.Policy.on_global_var_update# Policy.on_global_var_update(global_vars: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor]) → None[源代码]# 在全局变量更新时调用。 参数: global_vars – 按字符串键广播的全局变量,从驱动程序发出。