热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

DAY7:神经网络及深度学习基础算法的优化(deeplearning.ai)

一、mini-batch gradient descent(批量梯度下降法)

DAY7: 神经网络及深度学习基础--算法的优化(deeplearning.ai)

DAY7: 神经网络及深度学习基础--算法的优化(deeplearning.ai)

mini-batch size的确定(结余1~m之间,有利于充分利用向量化和每次训练部分样本以提高训练速度

①对于样本总数小于2000个时,用总体的梯度下降法

②典型的mini-batch size的大小为 2^6=64,2^7=128,2^8=256,2^9=512,为2的次方时有利于GPU/CPU的计算

③对于每一组batch应该满足GPU/CPU的内存要求

DAY7: 神经网络及深度学习基础--算法的优化(deeplearning.ai)

DAY7: 神经网络及深度学习基础--算法的优化(deeplearning.ai)

DAY7: 神经网络及深度学习基础--算法的优化(deeplearning.ai)


二、Exponentially weighted averages(指数加权平均值/滑动平均值)

DAY7: 神经网络及深度学习基础--算法的优化(deeplearning.ai)

指数加权求平均值的算法执行时只占用一个数字,一行代码,占用的内存很小。是一种不错的求加权平均值的方法。

当β=0.9时,1/(1-β)=10.只需要过去十天的数据便可以计算出平均值。同理,当β=0.98时,1/(1-β)=1/ε=50,需要

用到过去50天的数据才能计算出加权平均值。

DAY7: 神经网络及深度学习基础--算法的优化(deeplearning.ai)

DAY7: 神经网络及深度学习基础--算法的优化(deeplearning.ai)

三、偏差修正(bias correction)

公式:vt = vt/(1-β^t)【注:β=0.9是一个很好的鲁棒数】

由于初始化V0=0,则V1=0.9*0+0.1*θ1=0.1θ1会明显小于第一天的数据,同理可得,V1也会出现类似的偏差

用于修正训练早期对于平均值的估计存在的误差,t代表当前的天数,随着天数的增加,分母会趋近于0。因此其

只对早期的指数加权平均值起作用,其作用效果就是使得紫线趋近于绿线。当然也可以也可以选择不对早期的数据

进行处理,因为随着天数的不断增加,紫线便会和绿线重合。

DAY7: 神经网络及深度学习基础--算法的优化(deeplearning.ai)

四、Momentum梯度下降法

Momentum梯度下降法由于一般的梯度下降法,Momentum梯度下降法通过指数平均权重的方法来求出dw,可以使得其

在梯度下降时在纵向的摆动幅度减小(详见下图),使得收敛的速度加快(若纵向的摆动幅度太大,为了不使得梯度下降

时迭代越界超出了函数的定义域,学习率α不能设置太大因此直接梯度下降法的收敛速度慢于Momentum梯度下降法)。

DAY7: 神经网络及深度学习基础--算法的优化(deeplearning.ai)

DAY7: 神经网络及深度学习基础--算法的优化(deeplearning.ai)








推荐阅读
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • OCR:用字符识别方法将形状翻译成计算机文字的过程Matlab:商业数学软件;CUDA:CUDA™是一种由NVIDIA推 ... [详细]
  • 本文介绍了操作系统的定义和功能,包括操作系统的本质、用户界面以及系统调用的分类。同时还介绍了进程和线程的区别,包括进程和线程的定义和作用。 ... [详细]
  • 程度|也就是_论文精读:Neural Architecture Search without Training
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了论文精读:NeuralArchitectureSearchwithoutTraining相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 本文介绍了Windows操作系统的版本及其特点,包括Windows 7系统的6个版本:Starter、Home Basic、Home Premium、Professional、Enterprise、Ultimate。Windows操作系统是微软公司研发的一套操作系统,具有人机操作性优异、支持的应用软件较多、对硬件支持良好等优点。Windows 7 Starter是功能最少的版本,缺乏Aero特效功能,没有64位支持,最初设计不能同时运行三个以上应用程序。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 本文介绍了腾讯最近开源的BERT推理模型TurboTransformers,该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想,通过简化问题和加速开发,实现了快速推理能力。同时,文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题,并提出了合并计算的解决方案。 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • Learning to Paint with Model-based Deep Reinforcement Learning
    本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 通过Anaconda安装tensorflow,并安装运行spyder编译器的完整教程
    本文提供了一个完整的教程,介绍了如何通过Anaconda安装tensorflow,并安装运行spyder编译器。文章详细介绍了安装Anaconda、创建tensorflow环境、安装GPU版本tensorflow、安装和运行Spyder编译器以及安装OpenCV等步骤。该教程适用于Windows 8操作系统,并提供了相关的网址供参考。通过本教程,读者可以轻松地安装和配置tensorflow环境,以及运行spyder编译器进行开发。 ... [详细]
  • vb.net不用多线程如何同时运行两个过程?不用多线程?即使用多线程,也不会是“同时”执行,题主只要略懂一些计算机编译原理就能明白了。不用多线程更不可能让两个过程同步执行了。不过可 ... [详细]
author-avatar
怡智俊婷珮婷
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有