热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

tensorflow量化感知训练_谷歌发布了用于TensorFlow模型优化的量化感知训练

谷歌宣布了他们的TensorFlow模型优化工具包的量化感知训练(QAT)API的发布。QAT在神经网络训练过程中模拟低精度的硬件,将量化误差加入到整体网络损耗的度量

谷歌宣布了他们的TensorFlow模型优化工具包的量化感知训练(QAT) API的发布。QAT在神经网络训练过程中模拟低精度的硬件,将量化误差加入到整体网络损耗的度量中,使得训练过程尽量减少训练后量化的影响。

在最近的TensorFlow开发峰会上,谷歌软件工程师Pulkit Bhuwalka概述了新的API。TensorFlow的移动和物联网工具包TensorFlow Lite支持训练后的模型量化,可以将模型大小减少到4倍,并将推理速度提高到1.5倍。然而,量化降低了计算的精度,降低了模型的精度。通过模拟训练过程中的推理时间量化误差,QAT得到了“对量化更有鲁棒性”的模型。QAT API还支持自定义量化策略的模拟,这使得研究人员可以将他们的模型用于其他平台和量化算法,而不是目前由TensorFlow Lite支持的那些。TensorFlow模型优化团队在博客中写道,

我们非常兴奋地看到,QAT API进一步使TensorFlow用户能够在他们的TensorFlow litt产品中推进高效执行的边界,以及它如何为研究新的量化算法和进一步开发不同精度级别的新硬件平台打开大门。

许多最先进的深度学习模型太大,速度太慢,无法在移动设备和物联网设备上按现状使用,这些设备往往对所有资源都有限制——包括电力、存储、内存和处理器速度。量化通过存储模型参数和使用8位整数而不是32位浮点数执行计算来减少模型大小。这改善了模型的性能,但在计算中引入了错误,降低了模型的精度。这些错误随着计算最终答案所需的每个操作而累积。QAT的观点是,通过在训练过程中模拟这些误差,这些误差成为损失度量的一部分,并通过训练过程使损失最小化;因此,该模型是“预先建立的”,以补偿量化误差。

此外,由于数据输入和隐藏层激活的量化需要对这些值进行缩放,因此量化算法需要了解这些数据的分布情况;特别是它们的最大值和最小值。训练后的量化方案通常需要一个校准步骤来确定定标因子,但如果没有使用具有良好代表性的样本,则很容易出错。QAT通过维护选择好的比例因子所需的统计信息来改进这个过程;本质上,“学习”正确的数据量化。

TensorFlow模型优化在去年夏天引入了完整的训练后整数量化,但是量化感知训练只能作为一个非官方的“contrib”包使用。去年年底,TensorFlow在深度学习框架领域的主要竞争对手PyTorch发布了自己的官方量化感知培训工具。



推荐阅读
  • 干货 | 携程AI推理性能的自动化优化实践
    作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品,其中性能优化组为AI模型提供全方位的优化方案,提升推理性能降低成本࿰ ... [详细]
  • 「爆干7天7夜」入门AI人工智能学习路线一条龙,真的不能再透彻了
    前言应广大粉丝要求,今天迪迦来和大家讲解一下如何去入门人工智能,也算是迪迦对自己学习人工智能这么多年的一个总结吧,本条学习路线并不会那么 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 本文介绍了腾讯最近开源的BERT推理模型TurboTransformers,该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想,通过简化问题和加速开发,实现了快速推理能力。同时,文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题,并提出了合并计算的解决方案。 ... [详细]
  • cs231n Lecture 3 线性分类笔记(一)
    内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注:中文翻译 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 2017亚马逊人工智能奖公布:他们的AI有什么不同?
    事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • OCR:用字符识别方法将形状翻译成计算机文字的过程Matlab:商业数学软件;CUDA:CUDA™是一种由NVIDIA推 ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • Two Sigma人均22万英镑~
    近期原创文章: ... [详细]
  • SLAM优秀开源工程最全汇总
    https:zhuanlan.zhihu.comp145750808 1、CartographerCartographer是一个系统,可跨多个平台和传感器配置以2D和3D形式提供实 ... [详细]
author-avatar
乌桥老鹅
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有