热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

tensorflow量化感知训练_谷歌发布了用于TensorFlow模型优化的量化感知训练

谷歌宣布了他们的TensorFlow模型优化工具包的量化感知训练(QAT)API的发布。QAT在神经网络训练过程中模拟低精度的硬件,将量化误差加入到整体网络损耗的度量

谷歌宣布了他们的TensorFlow模型优化工具包的量化感知训练(QAT) API的发布。QAT在神经网络训练过程中模拟低精度的硬件,将量化误差加入到整体网络损耗的度量中,使得训练过程尽量减少训练后量化的影响。

在最近的TensorFlow开发峰会上,谷歌软件工程师Pulkit Bhuwalka概述了新的API。TensorFlow的移动和物联网工具包TensorFlow Lite支持训练后的模型量化,可以将模型大小减少到4倍,并将推理速度提高到1.5倍。然而,量化降低了计算的精度,降低了模型的精度。通过模拟训练过程中的推理时间量化误差,QAT得到了“对量化更有鲁棒性”的模型。QAT API还支持自定义量化策略的模拟,这使得研究人员可以将他们的模型用于其他平台和量化算法,而不是目前由TensorFlow Lite支持的那些。TensorFlow模型优化团队在博客中写道,

我们非常兴奋地看到,QAT API进一步使TensorFlow用户能够在他们的TensorFlow litt产品中推进高效执行的边界,以及它如何为研究新的量化算法和进一步开发不同精度级别的新硬件平台打开大门。

许多最先进的深度学习模型太大,速度太慢,无法在移动设备和物联网设备上按现状使用,这些设备往往对所有资源都有限制——包括电力、存储、内存和处理器速度。量化通过存储模型参数和使用8位整数而不是32位浮点数执行计算来减少模型大小。这改善了模型的性能,但在计算中引入了错误,降低了模型的精度。这些错误随着计算最终答案所需的每个操作而累积。QAT的观点是,通过在训练过程中模拟这些误差,这些误差成为损失度量的一部分,并通过训练过程使损失最小化;因此,该模型是“预先建立的”,以补偿量化误差。

此外,由于数据输入和隐藏层激活的量化需要对这些值进行缩放,因此量化算法需要了解这些数据的分布情况;特别是它们的最大值和最小值。训练后的量化方案通常需要一个校准步骤来确定定标因子,但如果没有使用具有良好代表性的样本,则很容易出错。QAT通过维护选择好的比例因子所需的统计信息来改进这个过程;本质上,“学习”正确的数据量化。

TensorFlow模型优化在去年夏天引入了完整的训练后整数量化,但是量化感知训练只能作为一个非官方的“contrib”包使用。去年年底,TensorFlow在深度学习框架领域的主要竞争对手PyTorch发布了自己的官方量化感知培训工具。



推荐阅读
  • 2019年斯坦福大学CS224n课程笔记:深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析
    本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理(NLP)领域的应用,重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析,深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]
  • 谷歌工程师:TensorFlow已重获新生;网友:我还是用PyTorch
    乾明发自凹非寺量子位报道|公众号QbitAI道友留步!TensorFlow已重获新生。在“PyTorch真香”的潮流中,有人站出来为TensorFlow说话了。这次来自谷歌的工程师 ... [详细]
  • 利用TensorFlow.js在网页浏览器中实现高效的人脸识别JavaScript接口
    作者|VincentMühle编译|姗姗出品|人工智能头条(公众号ID:AI_Thinker)【导读】随着深度学习方法的应用,浏览器调用人脸识别技术已经得到了更广泛的应用与提升。在 ... [详细]
  • 本文详细介绍了 Java 网站开发的相关资源和步骤,包括常用网站、开发环境和框架选择。 ... [详细]
  • 本文介绍了如何使用 Google Colab 的免费 GPU 资源进行深度学习应用开发。Google Colab 是一个无需配置即可使用的云端 Jupyter 笔记本环境,支持多种深度学习框架,并且提供免费的 GPU 计算资源。 ... [详细]
  • 目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • 浅层神经网络解析:本文详细探讨了两层神经网络(即一个输入层、一个隐藏层和一个输出层)的结构与工作原理。通过吴恩达教授的课程,读者将深入了解浅层神经网络的基本概念、参数初始化方法以及前向传播和反向传播的具体实现步骤。此外,文章还介绍了如何利用这些基础知识解决实际问题,并提供了丰富的实例和代码示例。 ... [详细]
  • 超分辨率技术的全球研究进展与应用现状综述
    本文综述了图像超分辨率(Super-Resolution, SR)技术在全球范围内的最新研究进展及其应用现状。超分辨率技术旨在从单幅或多幅低分辨率(Low-Resolution, LR)图像中恢复出高质量的高分辨率(High-Resolution, HR)图像。该技术在遥感、医疗成像、视频处理等多个领域展现出广泛的应用前景。文章详细分析了当前主流的超分辨率算法,包括基于传统方法和深度学习的方法,并探讨了其在实际应用中的优缺点及未来发展方向。 ... [详细]
  • 不用蘑菇,不拾金币,我通过强化学习成功通关29关马里奥,创造全新纪录
    《超级马里奥兄弟》由任天堂于1985年首次发布,是一款经典的横版过关游戏,至今已在多个平台上售出超过5亿套。该游戏不仅勾起了许多玩家的童年回忆,也成为强化学习领域的热门研究对象。近日,通过先进的强化学习技术,研究人员成功让AI通关了29关,创造了新的纪录。这一成就不仅展示了强化学习在游戏领域的潜力,也为未来的人工智能应用提供了宝贵的经验。 ... [详细]
  • 模糊神经网络的训练策略与学习算法优化
    本文探讨了模糊神经网络的训练策略与学习算法优化,详细分析了基于FPGA和MATLAB的实现方法。通过改进的学习算法,提高了模糊神经网络在复杂环境下的适应性和准确性,为相关领域的研究者提供了有价值的参考和技术支持。 ... [详细]
  • 利用 PyTorch 实现 Python 中的高效矩阵运算 ... [详细]
author-avatar
乌桥老鹅
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有