ray.tune.Tuner.restore#

classmethod Tuner.restore(path: str, trainable: str | Callable | Type[Trainable] | BaseTrainer, resume_unfinished: bool = True, resume_errored: bool = False, restart_errored: bool = False, param_space: Dict[str, Any] | None = None, storage_filesystem: pyarrow.fs.FileSystem | None = None, _resume_config: ResumeConfig | None = None) Tuner[源代码]#

在之前的运行失败后恢复调谐器。

现有运行中的所有试验都将被添加到结果表中。参数标志控制如何恢复现有的但未完成或出错的试验。

完成的试验总是会被添加到概览表中。它们不会被恢复。

未完成的试验可以通过 resume_unfinished 标志来控制。如果为 True``(默认),它们将继续进行。如果为 ``False,它们将被添加为已终止的试验(即使它们只是被创建而从未训练过)。

错误的试验可以通过 resume_erroredrestart_errored 标志来控制。前者将从最近的检查点恢复错误的试验。后者将从头开始重新启动错误的试验,并阻止加载它们的最后一个检查点。

备注

从指向与原始实验路径*不同*位置的路径恢复实验是受支持的。然而,Ray Tune 假设整个实验目录是可用的(包括检查点),以便可以从其最新状态恢复试验。

例如,如果原始实验路径是在本地运行的,那么结果会上传到云存储,Ray Tune 期望在通过 Tuner.restore("s3://...") 尝试恢复时,云存储中包含完整的内容。恢复的运行将继续将结果写入相同的云存储位置。

参数:
  • path – 中断或失败运行的实验目录的本地或远程路径。请注意,所有试验都完成的实验将不会恢复。此信息可以在上次运行控制台输出的末尾附近轻松找到。

  • trainable – 在恢复实验时使用的可训练对象。这应该是用于初始化原始 Tuner 的同一个可训练对象。

  • param_space – 传递给原始 Tuner 的相同 param_space。由于 param_space 可能包含 Ray 对象引用(在数据集上进行调优或在多个 ray.put 对象引用上进行调优),因此可以选择性地重新指定。Tune 期望 `param_space` 保持不变,恢复期间将使用的唯一部分是更新的对象引用。通过此 API 不支持更改超参数搜索空间然后恢复。

  • resume_unfinished – 如果为真,将继续运行未完成的试验。

  • resume_errored – 如果为 True,将重新安排出错的试验,并尝试从其最新的检查点恢复。

  • restart_errored – 如果为 True,将重新安排出错的试验,但会强制从头开始重新启动(不会加载检查点)。

  • storage_filesystem – 自定义 pyarrow.fs.FileSystem 对应于 路径 。如果原始实验传入了自定义文件系统,这可能是必要的。

  • _resume_config – [实验性] 控制如何恢复不同状态试验的配置对象。可以作为上述 resume_*restart_* 标志的替代品。