ZeRO 和 DeepSpeed:新的系统优化使得训练超过1000亿参数的模型成为可能 2020年2月13日 Direct Link Twitter Facebook LinkedIn Previous Next