ray.tune.Tuner.restore#
- classmethod Tuner.restore(path: str, trainable: str | Callable | Type[Trainable] | BaseTrainer, resume_unfinished: bool = True, resume_errored: bool = False, restart_errored: bool = False, param_space: Dict[str, Any] | None = None, storage_filesystem: pyarrow.fs.FileSystem | None = None, _resume_config: ResumeConfig | None = None) Tuner [源代码]#
在之前的运行失败后恢复调谐器。
现有运行中的所有试验都将被添加到结果表中。参数标志控制如何恢复现有的但未完成或出错的试验。
完成的试验总是会被添加到概览表中。它们不会被恢复。
未完成的试验可以通过
resume_unfinished
标志来控制。如果为True``(默认),它们将继续进行。如果为 ``False
,它们将被添加为已终止的试验(即使它们只是被创建而从未训练过)。错误的试验可以通过
resume_errored
和restart_errored
标志来控制。前者将从最近的检查点恢复错误的试验。后者将从头开始重新启动错误的试验,并阻止加载它们的最后一个检查点。备注
从指向与原始实验路径*不同*位置的路径恢复实验是受支持的。然而,Ray Tune 假设整个实验目录是可用的(包括检查点),以便可以从其最新状态恢复试验。
例如,如果原始实验路径是在本地运行的,那么结果会上传到云存储,Ray Tune 期望在通过
Tuner.restore("s3://...")
尝试恢复时,云存储中包含完整的内容。恢复的运行将继续将结果写入相同的云存储位置。- 参数:
path – 中断或失败运行的实验目录的本地或远程路径。请注意,所有试验都完成的实验将不会恢复。此信息可以在上次运行控制台输出的末尾附近轻松找到。
trainable – 在恢复实验时使用的可训练对象。这应该是用于初始化原始 Tuner 的同一个可训练对象。
param_space – 传递给原始 Tuner 的相同
param_space
。由于param_space
可能包含 Ray 对象引用(在数据集上进行调优或在多个ray.put
对象引用上进行调优),因此可以选择性地重新指定。Tune 期望 `param_space` 保持不变,恢复期间将使用的唯一部分是更新的对象引用。通过此 API 不支持更改超参数搜索空间然后恢复。resume_unfinished – 如果为真,将继续运行未完成的试验。
resume_errored – 如果为 True,将重新安排出错的试验,并尝试从其最新的检查点恢复。
restart_errored – 如果为 True,将重新安排出错的试验,但会强制从头开始重新启动(不会加载检查点)。
storage_filesystem – 自定义
pyarrow.fs.FileSystem
对应于路径
。如果原始实验传入了自定义文件系统,这可能是必要的。_resume_config – [实验性] 控制如何恢复不同状态试验的配置对象。可以作为上述
resume_*
和restart_*
标志的替代品。