ray.rllib.algorithms.algorithm.Algorithm.保存检查点#

Algorithm.save_checkpoint(checkpoint_dir: str) → None[源代码]#

将检查点导出到本地目录。

算法检查点目录的结构将如下所示:

policies/
    pol_1/
        policy_state.pkl
    pol_2/
        policy_state.pkl
learner/
    learner_state.json
    module_state/
        module_1/
            ...
    optimizer_state/
        optimizers_module_1/
            ...
rllib_checkpoint.json
algorithm_state.pkl

注意：rllib_checkpoint.json 包含一个“version”键（例如值为0.1），这有助于RLlib在从Ray 2.0及以后的版本恢复检查点时保持向后兼容性。

参数:: checkpoint_dir – 存储检查点文件的目录。