调优实验
在本教程中,学习如何调整实验。将要调整的实验是由pytorch_mnist.py示例脚本创建的。
先决条件
- 克隆 clearml 仓库。
- 安装requirements以获取TensorFlow示例。
- 拥有ClearML Agent 已安装和配置.
步骤 1: 运行实验
在examples/frameworks/pytorch
目录中,运行实验脚本:
python pytorch_mnist.py
步骤 2: 克隆实验
克隆实验以创建可编辑的副本进行调整。
-
在ClearML WebApp(UI)中,在项目页面上,点击
examples
项目卡片。 -
在实验表中,右键点击实验
pytorch mnist train
。 -
在上下文菜单中,点击克隆 > 克隆。新克隆的实验会出现,并且其信息面板会滑动打开。
步骤3:调整克隆的实验
为了演示调优,更改两个超参数值。
-
在信息面板中,配置 > 超参数 > 参数 > 悬停并点击编辑。
-
将
batch_size
的值从64
更改为32
。 -
将
lr
的值从0.01
更改为0.025
。 -
点击保存。
步骤4:运行一个监听队列的工作守护进程
要执行克隆的实验,请使用ClearML Agent。
在本地开发机器上运行代理:
-
打开一个终端会话。
-
运行以下
clearml-agent
命令,该命令将运行一个监听default
队列的工作守护进程:clearml-agent daemon --queue default
此命令的响应是关于配置、工作器和队列的信息。例如:
Current configuration (clearml_agent v0.16.0, location: /home/<username>/clearml.conf):
----------------------
agent.worker_id =
agent.worker_name = LAPTOP-PPTKKPGK
agent.python_binary =
agent.package_manager.type = pip
.
.
.
sdk.development.worker.report_period_sec = 2
sdk.development.worker.ping_period_sec = 30
sdk.development.worker.log_stdout = true
Worker "LAPTOP-PPTKKPGK:0" - Listening to queues:
+ ---------------------------------+---------+-------+
| id | name | tags |
+ ---------------------------------+---------+-------+
| 2a03daf5ff9a4255b9915fbd5306f924 | default | |
+ ---------------------------------+---------+-------+
Running CLEARML-AGENT daemon in background mode, writing stdout/stderr to /home/<username>/.clearml_agent_daemon_outym6lqxrz.txt
步骤5:将调优实验加入队列
将调优的实验加入队列。
-
在ClearML WebApp > 实验表中,右键点击实验
Clone Of pytorch mnist train
。 -
在上下文菜单中,点击Enqueue。
-
选择默认队列。
-
点击ENQUEUE。实验的状态变为待定。当工作者从队列中获取实验时,状态变为运行中。实验的进度可以在信息面板中查看。当状态变为已完成时,继续下一步。
步骤6:比较实验
比较原始和调整后的实验:
-
在ClearML WebApp(UI)中,在项目页面上,点击
examples
项目。 -
在实验表中,选择两个实验的复选框:
pytorch mnist train
和Clone Of pytorch mnist train
。 -
在实验表底部的菜单栏上,点击COMPARE。实验比较窗口将出现。 所有差异将以不同的背景颜色显示以突出它们。
实验比较窗口按以下标签组织:
- 详细信息 - 工件部分,包括输入和输出模型及其网络设计,以及其他工件; 执行部分的执行,包括源代码控制、安装的Python包和版本、 未提交的更改,以及Docker镜像名称,在这种情况下为空。
- 超参数 - 超参数及其值。
- SCALARS - 标量指标,可以选择以图表或数值的形式查看。
- PLOTS - 任何数据的图表,可以选择以图表或数值形式查看。
- 调试样本 - 包括图像、音频和视频的媒体,由您的实验上传,显示为缩略图。
-
检查差异。
- Compare the hyperparameters. In the HYPERPARAMETERS tab, expand ARGS. The hyperparameters
batch_size
andlr
are shown with a different background color. The values are different. - Compare the metrics. In the SCALARS tab, to the right of Add Experiment, select the plot or value comparison:
- 图表 - 标量指标图显示了
pytorch mnist train
和Clone of pytorch mnist train
。 - 最后值 - 展开一个指标和变体。
- 图表 - 标量指标图显示了
- Compare the hyperparameters. In the HYPERPARAMETERS tab, expand ARGS. The hyperparameters
下一步
- 有关编辑实验的更多信息,请参见修改实验。