ray.rllib.policy.Policy.from_state#

static Policy.from_state(state: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor | dict | tuple]) Policy[源代码]#

从状态对象中恢复策略。

可以通过调用其 get_state 方法来获取实例化策略的 状态。这仅适用于 V2 策略类(EagerTFPolicyV2、SynamicTFPolicyV2 和 TorchPolicyV2)。它包含创建策略所需的所有信息。不需要访问原始代码(例如配置、策略类的知识等)。

参数:

state – 从该状态恢复一个新的 Policy 实例。

返回:

一个新的 Policy 实例。