Register for Ray Summit 2024 with keynotes from Mira Murati, Marc Andreessen, and Anastasis Germanidis.

ray.rllib.utils.policy.从检查点解析策略规格#

ray.rllib.utils.policy.parse_policy_specs_from_checkpoint(path: str) → Tuple[dict, Dict[str, PolicySpec], Dict[str, Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor | dict | tuple]]][源代码]#

从检查点文件中读取并解析策略规范。

参数:: path – 策略检查点的路径。
返回:: 基本策略配置、策略规范字典和策略状态字典。
返回类型:: A tuple of

PublicAPI (alpha): 此API处于alpha阶段，可能在稳定之前发生变化。

优云智算