ray.rllib.policy.policy.Policy.set_state#

Policy.set_state(state: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor | dict | tuple]) None[源代码]#

state 恢复此策略的当前整个状态。

参数:

state – 要为此策略设置的新状态。可以通过调用 self.get_state() 获得。