ray.rllib.policy.policy.Policy.导出检查点#
- Policy.export_checkpoint(export_dir: str, filename_prefix=-1, *, policy_state: Dict[str, numpy.array | jnp.ndarray | tf.Tensor | torch.Tensor | dict | tuple] | None = None, checkpoint_format: str = 'cloudpickle') None [源代码]#
将导出策略检查点保存到本地目录并返回一个 AIR 检查点。
- 参数:
export_dir – 本地可写目录,用于存储 AIR 检查点信息。
policy_state – 一个可选的 PolicyState 写入磁盘。由
Algorithm.save_checkpoint()
使用,以节省其不同策略的self.get_state()
调用。checkpoint_format – 可以是 ‘cloudpickle’ 或 ‘msgpack’ 中的一个。
from ray.rllib.algorithms.ppo import PPOTorchPolicy policy = PPOTorchPolicy(...) policy.export_checkpoint("/tmp/export_dir")