ray.rllib.utils.policy.从检查点解析策略规格#
- ray.rllib.utils.policy.parse_policy_specs_from_checkpoint(path: str) Tuple[dict, Dict[str, PolicySpec], Dict[str, Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor | dict | tuple]]] [源代码]#
从检查点文件中读取并解析策略规范。
- 参数:
path – 策略检查点的路径。
- 返回:
基本策略配置、策略规范字典和策略状态字典。
- 返回类型:
A tuple of
PublicAPI (alpha): 此API处于alpha阶段,可能在稳定之前发生变化。