ray.rllib.policy.Policy.from_state#
- static Policy.from_state(state: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor | dict | tuple]) Policy [源代码]#
从状态对象中恢复策略。
可以通过调用其
get_state
方法来获取实例化策略的状态
。这仅适用于 V2 策略类(EagerTFPolicyV2、SynamicTFPolicyV2 和 TorchPolicyV2)。它包含创建策略所需的所有信息。不需要访问原始代码(例如配置、策略类的知识等)。- 参数:
state – 从该状态恢复一个新的 Policy 实例。
- 返回:
一个新的 Policy 实例。