跟踪实验和可视化结果
在实验运行期间以及实验结束后的任何时间,都可以在ClearML Web UI中跟踪并可视化结果,包括:
- 执行详情 - Code, 用于ClearML Agent的基础Docker镜像,产物的输出目的地,以及日志级别。
- 配置 - 超参数、用户属性和配置对象。
- Artifacts - 输入模型、输出模型、模型快照位置、其他工件。
- Info - 扩展的实验信息,例如实验的开始、创建和最后更新时间及日期,创建实验的用户,以及其描述。
- Console - 标准输出、标准错误、从库输出到控制台,以及ClearML显式报告。
- 标量 - 指标图。
- 图表 - 其他图表和数据,例如:Matplotlib、Plotly 和 ClearML 显式报告。
- 调试样本 - 图像、音频、视频和HTML。
查看模式
ClearML Web UI 提供了两种查看实验详情的模式:
-
信息面板
-
Full screen detailed information mode.
两种模式都包含所有实验细节。当任一视图打开时,通过点击(在实验表格/全屏中查看),或点击(菜单)> 在实验表格/全屏中查看来切换到另一种模式。
信息面板
信息面板保持实验表格在视野中,以便可以从表格(以及信息面板中的菜单)执行实验操作。
点击 以 在实验表中隐藏详细信息,仅显示实验名称和状态
全屏详情视图
全屏详情视图使得查看和处理实验跟踪和结果更加容易。当全屏详情视图打开时,实验表格不可见。从菜单中执行实验操作。
执行
实验的执行标签列出了以下内容:
- Source Code
- Uncommitted changes
- 已安装的Python包
- Container Details
- Output Details
在全屏模式下,源代码和输出详细信息被分组在DETAILS部分。
源代码
实验的执行选项卡中的源代码部分包括:
- 实验的仓库
- Submission ID
- Script Path
- Working Directory
- 二进制(Python 可执行文件)
未提交的更改
ClearML 在未提交更改部分显示实验的 git diff。
已安装的包
“已安装的包”部分列出了实验已安装的Python包及其版本。
当执行实验的ClearML代理最终使用了一组与最初指定的不同的Python包时,原始规范(original pip
或 original conda
)以及代理最终用于设置环境的包(pip
或 conda
)都是可用的。在下拉菜单中选择要查看的需求。
容器
容器部分列出了以下信息:
- Image - ClearML Agent 将用于远程执行此实验的预配置 Docker(参见 构建Docker容器)
- 参数 - 添加Docker参数
- 设置 shell 脚本 - 一个在 Docker 内部执行并在设置实验环境之前运行的 bash 脚本
要通过UI在列出的容器中重新运行实验,执行实验的ClearML Agent必须在Docker模式下运行:
clearml-agent daemon --queue <execution_queue_to_pull_from> --docker [optional default docker image to use]
欲了解更多信息,请参阅Docker Mode。
输出
输出详细信息包括:
- 用于存储模型检查点(快照)和工件的输出目的地(另请参阅配置文件中的default_output_uri,以及
Task.init
参数中的output_uri
)。
<img alt="执行详情部分" class="img_ev3q" decoding="async" height="137" loading="lazy" src="
配置
所有参数和配置对象都显示在配置选项卡中。
超参数
超参数按其类型分组,并出现在配置 > 超参数中。一旦实验运行并存储在ClearML服务器中,这些超参数中的任何一个都可以被修改。
命令行参数
Args 组显示自动记录的参数解析器参数(例如 argparse
、click
、hydra
)。
将鼠标悬停在参数行上的 (菜单)上,如果提供了类型、描述和默认值,它们将会显示出来。
环境变量
如果在CLEARML_LOG_ENVIRONMENT
环境变量或sdk.development.log_os_environments
字段中列出了环境变量,环境组将显示列出的环境变量(参见此FAQ)。
CLEARML_LOG_ENVIRONMENT
变量总是会覆盖 clearml.conf
文件。
自定义参数组
自定义参数组显示参数字典,如果参数已连接到任务,使用
Task.connect()
并提供 name
参数。如果未提供名称,则 General
是默认部分。
TensorFlow 定义
TF_DEFINE 参数组显示自动 TensorFlow 日志记录。
用户属性
用户属性允许以键值对格式存储任何描述性信息。它们在任何实验中都可以编辑,除了状态为已发布的实验(只读)。
配置对象
ClearML 跟踪实验(任务)模型配置对象,这些对象出现在配置对象 > 常规中。
这些对象包括自动跟踪的对象,以及在代码中连接到任务的对象(参见Task.connect_configuration
)。
ClearML 支持为任务模型配置对象提供名称(请参阅 Task.connect_configuration
中的 name
参数)。
工件
任务工件,包括模型,出现在ARTIFACTS标签中。
每个非模型工件条目显示:
- File Path
- 文件大小
- 哈希
- Metadata (if set)
工件位置显示在FILE PATH
字段中。要访问模型和其他工件文件:
- 本地文件: 使用“复制到剪贴板”操作 () 获取文件路径,以便于本地存储访问,因为出于安全原因,Web应用程序被禁止访问本地磁盘。
- 远程文件(例如,带有
https://
、s3://
等URI的网络托管工件):使用下载操作()来检索文件。
模型
任务的输入和输出模型出现在ARTIFACTS标签中。每个模型条目显示:
- Model Name
- ID
- Configuration.
输入模型还会显示其创建实验,点击后将导航到实验的页面。
要查看更多模型详细信息,包括设计、标签枚举和一般信息,请点击模型名称以导航到MODELS选项卡中的页面(参见模型详细信息)。
信息
INFO 标签显示扩展的实验信息:
最新事件日志
此功能在ClearML企业版计划下可用。
企业服务器还显示任务活动的详细历史记录:
- Task operations (such as status changes, project moves, etc.)
- Operation Time
- 操作用户
- 操作来源(即 ClearML 代理、SDK 或 UI)
- 操作源版本
要下载任务历史记录为CSV文件,请将鼠标悬停在日志上并点击。
ClearML 维护了一个系统范围内的、大但严格的任务历史记录项限制。一旦达到限制,最旧的条目将被清除,以便为新条目腾出空间。
描述
在描述部分为实验添加描述性文本。要修改描述,请将鼠标悬停在描述框上并点击编辑。
实验详情
实验详情部分列出了描述实验的信息:
- Parent Experiment
- Project Name
- 创建、启动和最后更新的日期和时间
- 创建实验的用户
- 实验状态(状态)
- 实验是否已归档
- 运行时属性 - 关于运行实验的机器的信息,包括:
- 操作系统
- CUDA 驱动版本
- CPU 核心数量
- GPU 数量
- CPU / GPU 类型
- 内存大小
- 主机名
- 处理器
- Python 版本
- 实验进度
实验结果
控制台
包含所有打印到stdout和stderr的完整实验日志出现在CONSOLE标签中。完整的日志是可下载的。要查看日志的末尾,请点击Jump to end。
标量
所有由ClearML自动记录的标量,以及在代码中明确报告的标量,都会出现在SCALARS中。
图形视图
标量图视图 () 显示标量系列绘制为时间序列线图。为了提高显示效率,系列进行了子采样。要查看高分辨率,请将鼠标悬停在图表上并点击 以全屏模式查看系列。
全屏模式下的标量图不会自动刷新。点击 来更新图表。
单一值标量(参见Logger.report_single_value
)显示在Summary
表中。
使用标量工具来改进对标量指标的分析。在信息面板中,点击以使用这些工具。在全屏详细视图中,工具位于窗口的左侧。这些工具包括:
-
分组依据 - 请选择以下选项之一:
-
指标 - 同一图表上指标的所有变体
-
无 - 按指标和变体分组(单个指标-变体图)。
-
-
水平轴 - 选择x轴单位:
- 迭代次数
- 从开始时间 - 实验开始以来的时间
- 挂钟时间 - 本地时钟时间
-
曲线平滑 - 从下拉菜单中选择要使用的平滑算法:指数移动平均、高斯或运行平均。使用滑块配置平滑因子或手动指定值。
-
显示/隐藏图表 - 点击 来控制要显示的图表。例如,要显示特定的图表,点击 隐藏全部,然后点击 在你想要查看的每个图表上。
要在您的报告中嵌入标量图,请将鼠标悬停在图上并点击, 这将复制嵌入代码到剪贴板,以便放入您的报告中。与静态截图不同,嵌入的资源在显示报告时会被检索,使您的报告能够显示最新的数据。
请参阅下面的绘图控件。
指标值视图
指标值视图()显示您的指标的表格摘要,每行对应一个指标/变体:
- 首先 - 指标/变体系列的初始值
- 最后 - 指标/变体系列的最后一个值
- 最小值 - 指标/变体系列的最小值
- 最大值 - 指标/变体系列的最大值
- 平均值 - 指标/变体系列的平均值
如果特定指标/变体的所有值都相同,该行将显示一个符号。
选择使用以下选项之一来查看哪些指标:
- 使用快速筛选栏 () 仅显示名称符合部分字符串匹配的指标/变体
- 使用筛选菜单()通过点击它们的显示/隐藏按钮()来选择要查看的指标。点击隐藏/显示全部,可以快速隐藏/显示所有指标。
图表
非时间序列图出现在PLOTS中。这些包括由库生成的数据、可视化工具以及使用ClearML Logger明确报告的数据。这些可能包括2D和3D图、表格(Pandas和CSV文件)以及Plotly图。单个图可以通过标题显示/隐藏或过滤。
对于每个指标,显示最新报告的图表。
在全屏查看图表时(), 可以通过迭代滑块(或使用上下箭头键盘快捷键)查看较旧的迭代。使用 / 按钮(或使用左右箭头键盘快捷键)在当前迭代中查看上一个/下一个图表。
绘图控制
下表列出了可能适用于任何图表的绘图控件(位于SCALARS和PLOTS选项卡中)。 这些控件使您能够更好地分析结果。将鼠标悬停在图表上,控件就会出现。
Icon | Description |
---|---|
Download plots as PNG files. | |
Pan around plot. Click , click the plot, and then drag. | |
To examine an area, draw a dotted box around it. Click and then drag. | |
To examine an area, draw a dotted lasso around it. Click and then drag. | |
Zoom into a section of a plot. Zoom in - Click and drag over a section of the plot. Reset to original scale - Click . | |
Zoom in. | |
Zoom out. | |
Reset to autoscale after zooming (, , or ). | |
Reset axes after a zoom. | |
Show / hide spike lines. | |
| Set data hover mode:
|
Switch to logarithmic view. | |
Hide / show the legend. | |
Switch between original and auto-fitted plot dimensions. The original layout is the plot's user-defined dimensions. | |
Download plot data as a JSON file. | |
Download table plot data as a CSV file. | |
Expand plot to entire window. When used with scalar graphs, full screen mode displays plots with all data points, as opposed to an averaged plot | |
Refresh scalar graphs in full screen mode to update it. | |
Copy to clipboard the resource embed code. This opens the following options:
|
3D 绘图控制
Icon | Description |
---|---|
Switch to orbital rotation mode - rotate the plot around its middle point. | |
Switch to turntable rotation mode - rotate the plot around its middle point while constraining one axis | |
Reset axes to default position. |
调试示例
实验输出,如图像、音频和视频,会出现在DEBUG SAMPLES中。这些包括由库和可视化工具生成的数据,以及使用ClearML Logger明确报告的数据。
您可以通过报告的迭代中的指标查看调试样本。通过从样本上方的下拉菜单中选择一个指标来按指标过滤样本。最近的迭代首先显示。
对于每个指标,显示最新报告的调试样本。
点击示例以全屏查看。如果示例是视频或音频,全屏模式将包括一个播放器。
在全屏查看样本时,可以通过迭代滑块(或使用上/下箭头键盘快捷键)查看较旧的迭代。使用 / 按钮(或使用左/右箭头键盘快捷键)在当前迭代中转到上一个/下一个样本。
标记实验
标签是用户定义的、带有颜色编码的标签,可以添加到实验(以及管道、数据集和模型)中,以便轻松识别和分组实验。标签可以帮助组织、查询和自动化实验。例如,通过用于执行实验的机器类型、版本标签、团队名称或任何其他类别来标记实验。
你可以使用标签来在实验表中过滤你的实验(参见过滤列) 或者在代码中查询实验时使用(参见标签过滤器)。你可以根据标签触发 实验执行(参见TriggerScheduler)或自动 根据标签部署模型(参见ClearML Serving)。
添加标签:
- 点击实验 > 悬停在标签区域 > +添加标签 或 (菜单)
- 执行以下操作之一:
- 添加新标签 - 输入新标签名称 > (创建新标签)。
- 添加现有标签 - 点击一个标签。
- 自定义标签颜色 - 点击 标签颜色 > 点击标签图标 > 背景 或 前景 > 选择颜色 > 确定 > 关闭。
删除标签 - 将鼠标悬停在标签上并点击X。
定位实验(任务)ID
任务ID显示在实验页面的标题中。