ray.rllib.algorithms.algorithm.Algorithm.保存检查点#
- Algorithm.save_checkpoint(checkpoint_dir: str) None [源代码]#
将检查点导出到本地目录。
算法检查点目录的结构将如下所示:
policies/ pol_1/ policy_state.pkl pol_2/ policy_state.pkl learner/ learner_state.json module_state/ module_1/ ... optimizer_state/ optimizers_module_1/ ... rllib_checkpoint.json algorithm_state.pkl
注意:
rllib_checkpoint.json
包含一个“version”键(例如值为0.1),这有助于RLlib在从Ray 2.0及以后的版本恢复检查点时保持向后兼容性。- 参数:
checkpoint_dir – 存储检查点文件的目录。