ray.rllib.policy.Policy.导出检查点#

Policy.export_checkpoint(export_dir: str, filename_prefix=-1, *, policy_state: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor | dict | tuple] | None = None, checkpoint_format: str = 'cloudpickle') None[源代码]#

将导出策略检查点保存到本地目录并返回一个 AIR 检查点。

参数:
  • export_dir – 本地可写目录,用于存储 AIR 检查点信息。

  • policy_state – 一个可选的 PolicyState 写入磁盘。由 Algorithm.save_checkpoint() 使用,以节省其不同策略的 self.get_state() 调用。

  • checkpoint_format – 可以是 ‘cloudpickle’ 或 ‘msgpack’ 中的一个。

from ray.rllib.algorithms.ppo import PPOTorchPolicy
policy = PPOTorchPolicy(...)
policy.export_checkpoint("/tmp/export_dir")