Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.policy.Policy.from_state#

static Policy.from_state(state: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor | dict | tuple]) → Policy[源代码]#

从状态对象中恢复策略。

可以通过调用其 get_state 方法来获取实例化策略的 状态。这仅适用于 V2 策略类（EagerTFPolicyV2、SynamicTFPolicyV2 和 TorchPolicyV2）。它包含创建策略所需的所有信息。不需要访问原始代码（例如配置、策略类的知识等）。

参数:: state – 从该状态恢复一个新的 Policy 实例。
返回:: 一个新的 Policy 实例。