ray.rllib.policy.Policy.on_global_var_update#

Policy.on_global_var_update(global_vars: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor]) None[源代码]#

在全局变量更新时调用。

参数:

global_vars – 按字符串键广播的全局变量,从驱动程序发出。