Skip to main content

数据集详情

SDK version compatibility

数据集页面显示使用clearml v1.6或更新版本创建的数据集。
使用早期版本的clearml创建的数据集可在其原始项目中找到。

数据集页面列出了数据集的版本。对于选定的版本,数据集版本面板以图形形式显示其谱系。

数据集血缘关系

图中的每个节点代表一个数据集版本,并显示以下详细信息:

数据集节点信息

  • Version name and number
  • Version Size
  • Version Update Time
  • 版本详情按钮 - 将鼠标悬停在版本上并点击 console 以查看版本的 详情面板
archiving versions

您可以归档数据集版本,以便版本列表不会过于杂乱。点击列表顶部的OPEN ARCHIVE以打开归档并查看所有归档的版本。从归档中,您可以恢复版本以将其从归档中移除。您还可以永久删除版本。

Download Version List

您可以通过点击Download并选择以下选项之一来下载数据集版本列表作为CSV文件:

  • 下载屏幕上的项目 - 下载当前屏幕上显示的版本的值
  • 下载所有项目 - 下载此数据集中与当前活动过滤器匹配的所有版本的值

下载的数据由当前显示的表格列组成。

版本详情

版本信息

在数据集版本面板的右侧,查看版本信息,其中显示:

  • Version Name
  • Dataset ID
  • Parent Task Name (click to navigate to the parent task page)
  • 版本文件大小(原始和压缩)
  • Number of files
  • Number of Links
  • 与前一版本的更改
    • 添加的文件数量
    • 修改的文件数量
    • 删除的文件数量
    • 大小的变化
  • 版本描述 - 要修改,请将鼠标悬停在描述上并点击 Edit pencil,这将打开编辑窗口

版本信息

要查看版本的详细信息,请点击完整详情,这将打开数据集版本的任务页面

数据集任务信息

要查看谱系图中任何版本的信息,请点击其节点,版本信息面板将显示该版本的详细信息。

版本详情面板

点击信息面板左上角的DETAILS或将鼠标悬停在版本节点上并点击details以查看版本的详细信息面板。该面板包括三个选项卡:

  • 内容 - 表格总结了版本内容,包括文件名、文件大小和哈希值

    内容

  • 预览 - 数据集版本内容的预览。

    预览

  • CONSOLE - 数据集版本的控制台输出

    控制台

点击内容面板标题上的Expand以全屏查看面板。

数据集操作

下表描述了可以从数据集版本列表中执行的操作。

通过右键单击数据集版本列表中的版本,使用上下文菜单访问这些操作。

ActionDescription
Add TagUser-defined labels added to versions for grouping and organization.
ArchiveMove dataset versions to the dataset's archive.
RestoreAction available in the archive. Restore a version to the active dataset versions table.
DeleteDelete an archived version and its artifacts. This action is available only from the dataset's archive.

数据集操作

上述图表中提到的操作可以同时对多个版本执行。选择多个版本,然后使用上下文菜单或页面底部出现的栏对所选版本执行操作。

选择多个版本

通过点击每个相关版本左侧的复选框来选择多个版本。通过点击列表左上角的复选框清除任何现有选择。

点击列表左上角的复选框以选择当前可见的所有项目。

通过左上角复选框旁边的向下箭头,可以使用扩展的批量选择工具,从而选择超出当前屏幕上显示的项目:

  • 全部 - 选择数据集中的所有版本
  • None - 清除选择
  • 筛选 - 选择数据集中与当前活动筛选器匹配的所有版本