Facebook为AR/VR提出更高效DNN神经网络训练技术CPT

编辑：刘余欣 | 分类：论文 | 2021年4月30日

加入映维网会员

有效的深度神经网络训练

（映维网 2021年04月30日）由于需要大量的训练数据和参数，现代深度神经网络（DNN）的破纪录性能带来了高昂的训练成本，限制了大量应用对DNN智能解决方案的需求。举例来说，训练ResNet-50涉及1018次浮点运算，而且一个先进的（SOTA）GPU可能需要14天时间。

与此同时，庞大的DNN培训成本引起了越来越多的财务和环境问题。例如，据估计，训练一个DNN的费用可能超过1万美元，而排放的碳则和一辆汽车的生命周期排放一样高。同时，DNN的最新进展促进了对智能边缘设备的巨大需求，其中许多都需要机载现场学习，以确保在动态现实环境中的准确性。但在动态现实环境中，设备有限的资源和高昂的培训成本之间存在不匹配现象。

Facebook为AR/VR提出更高效DNN神经网络训练技术CPT

为了应对上述挑战，广泛的研究致力于发展有效的DNN训练技术。其中，低精度训练因其能极大地提高训练时间/能量效率而备受关注。例如，GPU现在可以使用16位IEEE半精度浮点格式执行混合精度DNN训练。但是，现有的低精度研究尚未充分探索和利用最近研究发现的成果。特别是现有的研究大多是在整个训练过程中固定模型精度，采用静态量化策略。最近的DNN训练优化研究则提出了沿DNN训练轨迹的动态超参数。例如在一份研究中，较大的初始学习率有助于模型记忆更容易拟合和更具普遍性的模式。

......（全文 798 字，剩余 324 字）

请微信扫码通过小程序阅读完整文章
或者登入网站阅读完整文章
映维网会员可直接登入网站阅读
PICO员工可联系映维网免费获取权限