自动调优:自动发现提供良好训练速度的最佳DeepSpeed配置

我们引入了一个名为Autotuning的新功能,以自动发现提供良好训练速度的最佳DeepSpeed配置。模型训练中的一个痛点是要找出与性能相关的良好配置,例如微批量大小,以充分利用硬件并实现高吞吐量。这个配置探索过程通常是手动完成的,但由于模型训练会重复多次,并且使用良好的配置会带来好处,因此非常重要。手动调整过程不仅耗时,而且结果还依赖于硬件。这意味着在一个硬件上良好的配置在另一个不同的硬件上可能不是最佳的。因此,用户必须再次手动调整配置。使用DeepSpeed,有更多的配置参数可能会影响训练速度,因此手动调整配置更加繁琐。

DeepSpeed Autotuner 减轻了这一痛点,并自动发现提供良好训练速度的最佳 DeepSpeed 配置。它不仅减少了用户在调优上花费的时间和资源,还能发现比手动调优方法更好的配置。DeepSpeedExamples 将展示自动调优在不同模型中的有效性。

更新: