摘要:CosineWarmup是一种非常实用的训练策略,本次教程将带领大家实现该训练策略。教程将从理论和代码实战两个方面进行。本文分享自华为云社区《CosineWarmup理论介绍与代码实战》,作者:李长安。CosineWarmup是一种非常实用的训练策略,本次教程将带领大家实现该训练策略。教程将从理论和代码实战两个方面进行。在代码实战部分,模型采用LeNet-5模型进行测试,数据采用Cifar10数据集作为基准数据,Warmup最早出现于这篇文章中:Accurate,LargeMinibatchSGD:TrainingImageNetin1Hour,warmup类似于跑步中的热身,在刚刚开始