ray.rllib.utils.policy.从检查点解析策略规格#

ray.rllib.utils.policy.parse_policy_specs_from_checkpoint(path: str) Tuple[dict, Dict[str, PolicySpec], Dict[str, Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor | dict | tuple]]][源代码]#

从检查点文件中读取并解析策略规范。

参数:

path – 策略检查点的路径。

返回:

基本策略配置、策略规范字典和策略状态字典。

返回类型:

A tuple of

PublicAPI (alpha): 此API处于alpha阶段,可能在稳定之前发生变化。