Skip to main content

调优实验

在本教程中,学习如何调整实验。将要调整的实验是由pytorch_mnist.py示例脚本创建的。

先决条件

步骤 1: 运行实验

examples/frameworks/pytorch目录中,运行实验脚本:

python pytorch_mnist.py

步骤 2: 克隆实验

克隆实验以创建可编辑的副本进行调整。

  1. 在ClearML WebApp(UI)中,在项目页面上,点击examples项目卡片。

  2. 在实验表中,右键点击实验 pytorch mnist train

  3. 在上下文菜单中,点击克隆 > 克隆。新克隆的实验会出现,并且其信息面板会滑动打开。

步骤3:调整克隆的实验

为了演示调优,更改两个超参数值。

  1. 在信息面板中,配置 > 超参数 > 参数 > 悬停并点击编辑

  2. batch_size的值从64更改为32

  3. lr的值从0.01更改为0.025

  4. 点击保存

步骤4:运行一个监听队列的工作守护进程

要执行克隆的实验,请使用ClearML Agent

在本地开发机器上运行代理:

  1. 打开一个终端会话。

  2. 运行以下clearml-agent命令,该命令将运行一个监听default队列的工作守护进程:

    clearml-agent daemon --queue default

    此命令的响应是关于配置、工作器和队列的信息。例如:

    Current configuration (clearml_agent v0.16.0, location: /home/<username>/clearml.conf):
    ----------------------
    agent.worker_id =
    agent.worker_name = LAPTOP-PPTKKPGK
    agent.python_binary =
    agent.package_manager.type = pip
    .
    .
    .
    sdk.development.worker.report_period_sec = 2
    sdk.development.worker.ping_period_sec = 30
    sdk.development.worker.log_stdout = true

    Worker "LAPTOP-PPTKKPGK:0" - Listening to queues:
    + ---------------------------------+---------+-------+
    | id | name | tags |
    + ---------------------------------+---------+-------+
    | 2a03daf5ff9a4255b9915fbd5306f924 | default | |
    + ---------------------------------+---------+-------+

    Running CLEARML-AGENT daemon in background mode, writing stdout/stderr to /home/<username>/.clearml_agent_daemon_outym6lqxrz.txt

步骤5:将调优实验加入队列

将调优的实验加入队列。

  1. 在ClearML WebApp > 实验表中,右键点击实验 Clone Of pytorch mnist train

  2. 在上下文菜单中,点击Enqueue

  3. 选择默认队列。

  4. 点击ENQUEUE。实验的状态变为待定。当工作者从队列中获取实验时,状态变为运行中。实验的进度可以在信息面板中查看。当状态变为已完成时,继续下一步。

步骤6:比较实验

比较原始和调整后的实验:

  1. 在ClearML WebApp(UI)中,在项目页面上,点击examples项目。

  2. 在实验表中,选择两个实验的复选框:pytorch mnist trainClone Of pytorch mnist train

  3. 在实验表底部的菜单栏上,点击COMPARE。实验比较窗口将出现。 所有差异将以不同的背景颜色显示以突出它们。

    实验比较窗口按以下标签组织:

    • 详细信息 - 工件部分,包括输入和输出模型及其网络设计,以及其他工件; 执行部分的执行,包括源代码控制、安装的Python包和版本、 未提交的更改,以及Docker镜像名称,在这种情况下为空。
    • 超参数 - 超参数及其值。
    • SCALARS - 标量指标,可以选择以图表或数值的形式查看。
    • PLOTS - 任何数据的图表,可以选择以图表或数值形式查看。
    • 调试样本 - 包括图像、音频和视频的媒体,由您的实验上传,显示为缩略图。
  4. 检查差异。

    1. Compare the hyperparameters. In the HYPERPARAMETERS tab, expand ARGS. The hyperparameters batch_size and lr are shown with a different background color. The values are different.
    2. Compare the metrics. In the SCALARS tab, to the right of Add Experiment, select the plot or value comparison:
      • 图表 - 标量指标图显示了 pytorch mnist trainClone of pytorch mnist train
      • 最后值 - 展开一个指标和变体。

下一步

  • 有关编辑实验的更多信息,请参见修改实验