专注于武汉中小企业服务解决方案提供商

电脑维修、布线、安防监控、数据恢复、采购、回收

所属分类 > 家电维修 > 正文

百度英伟达联手推混合精度训练,同样性能只需一半内存 (英伟达官网链接)

编辑:rootadmin
这几年来,各科技大厂搞出了越来越大的神经网络,达到了越来越高的准确率,但同时,这些模型对内存和计算力的要求也越来越高。于是,有一部分研究者想要通过降低计算精度,来节约计算力。但运用混合精度或低精度运算往往会造成模型准确率的降低,还需要对网络进行修改。现在,这个问题有了新进展。  百度和英伟达今天展示了一项双方的联合研究,用bit半精度浮点数(FP)来训练神经网络,降低了训练所需内存的同时,在同样的超参数下达到了和bit单精度浮点数(FP)相同的准确率。  他们在一篇题为MixedPrecisionTraining的*中展示了这项训练神经网络的新技术。还分别在官方博客上发文(通俗地)介绍了这种“混合精度训练”。为什么要用混合精度,而不是直接改成FP呢?这要从神经网络中的通用矩阵乘法运算说起。深度学习模型中包含各种层,比如全连接层、卷积层、循环层等等,其中每一层都能用通用矩阵乘法(GEMM)运算来实现。在训练过程中,GEMM占据了大部分计算。  如下图所示,GEMM可以分个成几个乘法运算,在加上加法运算。

整理分享百度英伟达联手推混合精度训练,同样性能只需一半内存 (英伟达官网链接),希望有所帮助,仅作参考,欢迎阅读内容。

内容相关其他词:英伟达官方合作厂商,英伟达百度贴吧,英伟达官方合作伙伴,英伟达百度贴吧,英伟达合作厂商列表,百度英伟达合作,百度英伟达合作,英伟达百度贴吧,内容如对您有帮助,希望把内容链接给更多的朋友!

百度英伟达联手推混合精度训练,同样性能只需一半内存 (英伟达官网链接)

  △矩阵乘法  当运用FP表示神经网络中的数时,GEMM运算的输入矩阵由bit的数字构成,我们需要能执行bit计算来做乘法的硬件,同时还需要用bit计算和储存来做加法。没有bit来完成加法运算,训练大型深度神经网络就会非常困难。于是,研究员们对训练流程进行了一些修改。模型中的输入、权重、梯度和激活以FP表示。但只是简单地更改储存格式,有些模型无法达到与FP基准相同的准确率。为了搞定这个挑战,百度和英伟达联手提出了两项技术。  第一,维护一个FP格式的权重的主副本,用FP权重来做正向和反向传播,优化器中的梯度更新会被添加到主FP副本里,这个FP副本会再舍入到FP,在训练中运用。这个过程,每次训练迭代都会重复一遍,直到模型收敛。通过在训练中运用FP的权重,可以运用适用于半精度的、更快的硬件。下图显示了混合精度训练中的一次迭代:

  △深度学习模型的混合精度训练  第二,引入了损失缩放(loss-scaling)技术,损失缩放能恢复一些小的重要梯度,对恢复某些模型的准确率损失来说很有必要。在训练期间,一些权重梯度指数很小,在FP格式下会变成0。为了搞定这个问题,研究团队在反向传播开始时引入一个换算系数,来缩放损失,梯度也通过链式法则同时慢慢扩大,并能在FP中表示出来。在更新使用于权重之前,这些梯度还需要缩小。百度在DeepSpeech2模型上对这种方式进行了测验。他们用这种方式来训练了DeepSpeech2模型,进行语音识别。在运用同样模型架构和超参数的情况下,混合精度模型在英语和普通话数据集上,都达到了与FP模型同样的准确率。

  △用混合精度训练与FP训练DeepSpeech2模型的英语、汉语语音识别字错率(CER)  通过运用FP格式的权重,训练深度学习模型的内存需要也可以降低到单精度的一半。也就是说,训练同样一个模型、达到同样的性能,我们现在只需要原来一半的处理器。  另外,FP算术的峰值性能通常远高于FP计算,因此,混合精度训练通过运用FP的计算单元,能够实现更快的速度。而英伟达在博客上还介绍了混合精度训练在图像分类、对象检测等任务上的性能。

  如上图所示,混合精度训练的各种深度神经网络模型在图像分类上,不需要损失缩放就能达到与单精度训练差不多的准确率。而在对象检测任务上,混合精度训练实现的准确率甚至略高于FP基准。

标签: 英伟达官网链接


本文链接地址:https://www.iopcc.com/jiadian/48527.html转载请保留说明!

上一篇:苹果申请可折叠屏幕专利:下代iPhone X将用上可折叠屏幕 (苹果 可折叠)

下一篇:网络设备的性能参数是什么? (网络设备性能测试报告)

推荐内容:

怎么样把维修经验总结成有用的知识呢? (怎样才能维修)

怎么样把维修经验总结成有用的知识呢? (怎样才能维修)

,我们维修空调,关键的重点不是解决问题,而是查找问题的能力和继续学习的能力,你一旦拥有了查找问题的能力 ...

7805稳压集成芯片急剧发热原因及检测方法 (7805集成稳压器介绍)

7805稳压集成芯片急剧发热原因及检测方法 (7805集成稳压器介绍)

维修使用过程中遇到过五种外观封装形式,最常见的有直插式LM,TO-封装,这种稳压芯片在电饭锅电路中很常见。直插 ...

烧IGBT管的电磁炉维修方法与技巧 (烧igbt还有哪里问题)

烧IGBT管的电磁炉维修方法与技巧 (烧igbt还有哪里问题)

给大家介绍一种比较好的方法,我想对大家应有一定的用处:1、将目测和表测明显损坏的坏件装上(包括保险); ...

雷神911 Air游戏本测评:真正抓住玩家需要的游戏本 (雷神911air游戏测评)

雷神911 Air游戏本测评:真正抓住玩家需要的游戏本 (雷神911air游戏测评)

发布会中提到,衡量高性能笔记本的四个标准是运行速度、轻薄便携、功耗待机和游戏娱乐。在前几年中,笔记本的 ...

HUAWEI P20 Pro测评:三摄拍照地表最强 (华为p20 pro zol)

HUAWEI P20 Pro测评:三摄拍照地表最强 (华为p20 pro zol)

DxOMark是一家国外知名的权威相机测评机构,而DxOMark的评分榜单,则是国内外公认的权威榜单,能在DxOMark评分榜单上 ...

将三相电动机改制成单相电动机的方法 (三相电动机改单相电动机怎么改)

将三相电动机改制成单相电动机的方法 (三相电动机改单相电动机怎么改)

容器,从而实现将三相W电动机改为单相电动机的方法,电路图如图4-所示。整理分享将三相电动机改制成单相电动机 ...

用TNY275P组成的机顶盒开关电源电路图纸

用TNY275P组成的机顶盒开关电源电路图纸

理分享用TNY275P组成的机顶盒开关电源电路图纸,希望有所帮助,仅作参考,欢迎阅读内容。内容相关其他词:,内容如 ...

拼多多的便宜iPhone到底靠不靠谱?剑桥大学博士的回答亮了 (拼多多的便宜手机是真的吗)

拼多多的便宜iPhone到底靠不靠谱?剑桥大学博士的回答亮了 (拼多多的便宜手机是真的吗)

?相信很多网友都会有这个疑问。最近,就有人在头条上提问,G的新款iPhoneXR,别的平台领券后元,拼多多领券后元 ...

惠普众筹的HP AMP 120音响打印机图赏 (惠普zol)

惠普众筹的HP AMP 120音响打印机图赏 (惠普zol)

图赏(惠普zol),希望有所帮助,仅作参考,欢迎阅读内容。内容相关其他词:惠普众康(广东)生物技术股份有限公司,惠 ...

手把手教你彻底清理电脑机箱里的灰尘 (如何彻底)

手把手教你彻底清理电脑机箱里的灰尘 (如何彻底)

吗?你知道两年没有清理的电脑会是什么样的吗?你想让你的电脑变成这样吗?看看下图就知道了。整理分享手把手 ...

Copyright © 2023 武汉电脑维修 All Rights Reserved.

鄂ICP备2023003026号

免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢!邮箱: opceo@qq.com