PyTorch Abseil
pytorch_abseil.py
示例展示了如何将ClearML集成到使用PyTorch和absl.flags
的代码中。
示例脚本执行以下操作:
- 在PyTorch内置的MNIST数据集上训练一个简单的深度神经网络
- 在
examples
项目中创建一个名为pytorch mnist train with abseil
的实验 - ClearML 自动记录 absl.flags,以及由 PyTorch 创建的模型(及其快照)
- 通过调用
Logger.report_scalar()
记录额外的指标
标量
在示例脚本的 train
函数中,以下代码明确将标量报告给 ClearML:
Logger.current_logger().report_scalar(
"train",
"loss",
iteration=(epoch * len(train_loader) + batch_idx),
value=loss.item()
)
在test
方法中,代码明确报告了loss
和accuracy
标量。
Logger.current_logger().report_scalar(
"test", "loss", iteration=epoch, value=test_loss
)
Logger.current_logger().report_scalar(
"test",
"accuracy",
iteration=epoch,
value=(correct / len(test_loader.dataset))
)
这些标量可以在图表中可视化,这些图表会出现在ClearML 网页用户界面中的实验标量标签页。
超参数
ClearML 自动记录使用 abseil 标志定义的命令行选项。它们出现在 配置 > 超参数 > TF_DEFINE 中。
控制台
打印到控制台的训练进度文本,以及所有其他控制台输出,显示在控制台中。
工件
实验创建的模型会出现在实验的ARTIFACTS标签中。ClearML 会自动记录和跟踪使用 PyTorch 创建的模型和任何快照。
点击模型名称将带您到模型的页面,在那里您可以查看模型的详细信息并访问模型。