Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.policy.Policy.set_state#

Policy.set_state(state: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor | dict | tuple]) → None[源代码]#

从 state 恢复此策略的当前整个状态。

参数:: state – 要为此策略设置的新状态。可以通过调用 self.get_state() 获得。