Skip to main content

项目仪表板

Pro Plan Offering

ClearML 项目仪表板应用程序可在 ClearML Pro 计划下使用。

项目仪表板应用程序提供了项目或工作区进度的概览。它展示了任务状态和选定指标随时间变化的汇总视图,以及项目GPU和工作器使用情况。它还支持通过Slack集成对已完成/失败的任务进行警报/警告。

项目仪表板实例配置

  • 导入配置 - 导入一个应用实例配置文件。这将用文件中的值填充实例启动表单,可以在启动应用实例之前进行修改。

  • 仪表板标题 - 项目仪表板实例的名称,将出现在实例列表中

  • 监控 - 选择应用程序实例应监控的内容。选项包括:

    • 项目 - 监控特定项目。您可以选择一个选项来同时监控指定项目的子项目
    • 整个工作区 - 监控工作区中的所有项目
    警告

    如果你的工作区或指定项目包含大量实验,仪表板可能需要一段时间才能更新。

  • 监控指标 - 为应用程序实例指定一个要监控的指标。仪表板将展示所选指标随时间变化的聚合视图。

    • 监控指标 - 标题 - 要跟踪的指标标题
    • 监控指标 - 系列 - 要跟踪的指标系列(变体)
    • 监控指标 - 趋势 - 选择是否跟踪监控指标的最高值或最低值
  • Slack通知(可选)- 设置Slack集成以接收任务失败的通知。在附加选项下选择实验完成时提醒以设置任务完成时的提醒。

    • API Token - Slack工作区访问令牌
    • Channel Name - 将任务失败警报发布到的Slack频道
    • Alert Iteration Threshold - 触发Slack警报的最小任务迭代次数(在达到阈值之前失败的任务将被忽略)
  • 附加选项

    • 跟踪手动(非代理运行)实验 - 选择以在仪表板中包含未由代理执行的实验
    • 在实验完成时发出警报 - 选择以在警报中包含已完成的任务:在仪表板的任务警报部分和Slack警报中。
  • 导出配置 - 将应用程序实例配置导出为JSON文件,稍后可以导入以创建具有相同配置的新实例。

仪表板应用实例启动表单

仪表盘

一旦项目仪表板实例启动,其仪表板将显示有关项目的以下信息:

  • 任务状态摘要 - 按状态划分的任务百分比
  • 任务类型摘要 - 本地实验与代理实验的百分比
  • 实验摘要 - 按状态分类的任务数量随时间变化
  • 监控 - GPU利用率和GPU内存使用情况
  • 指标监控 - 随时间变化的指标值的聚合视图
  • 项目的活跃工作者 - 当前在监控项目中执行实验的工作者数量
  • 工人表 - 活跃工人列表
  • 任务警报
    • 失败的任务 - 失败的实验及其失败时间摘要
    • 已完成的任务 - 已完成的实验及其完成时间摘要
EMBEDDING CLEARML VISUALIZATION

您可以将应用程序实例仪表板中的图表嵌入到ClearML 报告中。这些可视化内容会随着应用程序实例的更新而实时更新。企业计划和托管服务支持将资源嵌入到外部工具中(例如 Notion)。将鼠标悬停在图表上并点击Embed code以复制嵌入代码,然后导航到报告并粘贴嵌入代码。

应用仪表板