Skip to main content

PyTorch Abseil

pytorch_abseil.py 示例展示了如何将ClearML集成到使用PyTorch和absl.flags的代码中。

示例脚本执行以下操作:

  • 在PyTorch内置的MNIST数据集上训练一个简单的深度神经网络
  • examples项目中创建一个名为pytorch mnist train with abseil的实验
  • ClearML 自动记录 absl.flags,以及由 PyTorch 创建的模型(及其快照)
  • 通过调用Logger.report_scalar()记录额外的指标

标量

在示例脚本的 train 函数中,以下代码明确将标量报告给 ClearML:

Logger.current_logger().report_scalar(
"train",
"loss",
iteration=(epoch * len(train_loader) + batch_idx),
value=loss.item()
)

test方法中,代码明确报告了lossaccuracy标量。

Logger.current_logger().report_scalar(
"test", "loss", iteration=epoch, value=test_loss
)
Logger.current_logger().report_scalar(
"test",
"accuracy",
iteration=epoch,
value=(correct / len(test_loader.dataset))
)

这些标量可以在图表中可视化,这些图表会出现在ClearML 网页用户界面中的实验标量标签页。

image

超参数

ClearML 自动记录使用 abseil 标志定义的命令行选项。它们出现在 配置 > 超参数 > TF_DEFINE 中。

image

控制台

打印到控制台的训练进度文本,以及所有其他控制台输出,显示在控制台中。

image

工件

实验创建的模型会出现在实验的ARTIFACTS标签中。ClearML 会自动记录和跟踪使用 PyTorch 创建的模型和任何快照。

image

点击模型名称将带您到模型的页面,在那里您可以查看模型的详细信息并访问模型。

image