当前位置: 开发笔记 > 编程语言 > 正文

DAY7:神经网络及深度学习基础算法的优化（deeplearning.ai）

作者：怡智俊婷珮婷 | 来源：互联网 | 2023-06-20 12:39

一、mini-batch gradient descent（批量梯度下降法）

DAY7: 神经网络及深度学习基础--算法的优化（deeplearning.ai）

mini-batch size的确定（结余1~m之间，有利于充分利用向量化和每次训练部分样本以提高训练速度）

①对于样本总数小于2000个时，用总体的梯度下降法

②典型的mini-batch size的大小为 2^6=64,2^7=128，2^8=256,2^9=512,为2的次方时有利于GPU/CPU的计算

③对于每一组batch应该满足GPU/CPU的内存要求

DAY7: 神经网络及深度学习基础--算法的优化（deeplearning.ai）

二、Exponentially weighted averages（指数加权平均值/滑动平均值）

DAY7: 神经网络及深度学习基础--算法的优化（deeplearning.ai）

指数加权求平均值的算法执行时只占用一个数字，一行代码，占用的内存很小。是一种不错的求加权平均值的方法。

当β=0.9时，1/(1-β)=10.只需要过去十天的数据便可以计算出平均值。同理，当β=0.98时，1/(1-β)=1/ε=50，需要

用到过去50天的数据才能计算出加权平均值。

DAY7: 神经网络及深度学习基础--算法的优化（deeplearning.ai）

三、偏差修正（bias correction）

公式：vt = vt/(1-β^t)【注:β=0.9是一个很好的鲁棒数】

由于初始化V0=0,则V1=0.9*0+0.1*θ1=0.1θ1会明显小于第一天的数据，同理可得，V1也会出现类似的偏差

用于修正训练早期对于平均值的估计存在的误差，t代表当前的天数，随着天数的增加，分母会趋近于0。因此其

只对早期的指数加权平均值起作用，其作用效果就是使得紫线趋近于绿线。当然也可以也可以选择不对早期的数据

进行处理，因为随着天数的不断增加，紫线便会和绿线重合。

DAY7: 神经网络及深度学习基础--算法的优化（deeplearning.ai）

四、Momentum梯度下降法

Momentum梯度下降法由于一般的梯度下降法，Momentum梯度下降法通过指数平均权重的方法来求出dw，可以使得其

在梯度下降时在纵向的摆动幅度减小（详见下图），使得收敛的速度加快（若纵向的摆动幅度太大，为了不使得梯度下降

时迭代越界超出了函数的定义域，学习率α不能设置太大因此直接梯度下降法的收敛速度慢于Momentum梯度下降法）。

DAY7: 神经网络及深度学习基础--算法的优化（deeplearning.ai）

推荐阅读

php
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
php
深度学习黑话

OCR：用字符识别方法将形状翻译成计算机文字的过程Matlab：商业数学软件；CUDA：CUDA™是一种由NVIDIA推 ... [详细]

蜡笔小新 2023-10-17 17:55:01
php
操作系统的定义和功能

本文介绍了操作系统的定义和功能，包括操作系统的本质、用户界面以及系统调用的分类。同时还介绍了进程和线程的区别，包括进程和线程的定义和作用。 ... [详细]

蜡笔小新 2023-12-11 14:17:13
input
程度|也就是_论文精读：Neural Architecture Search without Training

篇首语：本文由编程笔记#小编为大家整理，主要介绍了论文精读：NeuralArchitectureSearchwithoutTraining相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-16 16:33:20
format
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
hash
Android中高级面试必知必会，积累总结

本文介绍了Android中高级面试的必知必会内容，并总结了相关经验。文章指出，如今的Android市场对开发人员的要求更高，需要更专业的人才。同时，文章还给出了针对Android岗位的职责和要求，并提供了简历突出的建议。 ... [详细]

蜡笔小新 2023-12-14 14:53:02
hash
图解redis的持久化存储机制RDB和AOF的原理和优缺点

本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件，恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘，实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点，帮助读者更好地理解redis的持久化存储策略。 ... [详细]

蜡笔小新 2023-12-13 20:24:11
php
Windows操作系统的版本介绍及特点

本文介绍了Windows操作系统的版本及其特点，包括Windows 7系统的6个版本：Starter、Home Basic、Home Premium、Professional、Enterprise、Ultimate。Windows操作系统是微软公司研发的一套操作系统，具有人机操作性优异、支持的应用软件较多、对硬件支持良好等优点。Windows 7 Starter是功能最少的版本，缺乏Aero特效功能，没有64位支持，最初设计不能同时运行三个以上应用程序。 ... [详细]

蜡笔小新 2023-12-12 17:41:13
php
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
jsp
腾讯BERT推理模型TurboTransformers的快速推理能力

本文介绍了腾讯最近开源的BERT推理模型TurboTransformers，该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想，通过简化问题和加速开发，实现了快速推理能力。同时，文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题，并提出了合并计算的解决方案。 ... [详细]

蜡笔小新 2023-12-12 13:48:41
python
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
python
Learning to Paint with Model-based Deep Reinforcement Learning

本文介绍了一种基于模型的深度强化学习方法，通过结合神经渲染器，教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等，以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战，包括绘制纹理丰富的图像等。通过对比实验的结果，作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]

蜡笔小新 2023-12-11 10:27:44
format
Python实验报告文档中的文件和数据格式化操作

本文介绍了Python语言程序设计中文件和数据格式化的操作，包括使用np.savetext保存文本文件，对文本文件和二进制文件进行统一的操作步骤，以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]

蜡笔小新 2023-12-10 17:02:16
cmd
通过Anaconda安装tensorflow，并安装运行spyder编译器的完整教程

本文提供了一个完整的教程，介绍了如何通过Anaconda安装tensorflow，并安装运行spyder编译器。文章详细介绍了安装Anaconda、创建tensorflow环境、安装GPU版本tensorflow、安装和运行Spyder编译器以及安装OpenCV等步骤。该教程适用于Windows 8操作系统，并提供了相关的网址供参考。通过本教程，读者可以轻松地安装和配置tensorflow环境，以及运行spyder编译器进行开发。 ... [详细]

蜡笔小新 2023-12-09 09:46:32
php
包含vb.net同时运行的词条

vb.net不用多线程如何同时运行两个过程？不用多线程？即使用多线程，也不会是“同时”执行，题主只要略懂一些计算机编译原理就能明白了。不用多线程更不可能让两个过程同步执行了。不过可 ... [详细]

蜡笔小新 2023-10-17 18:18:35

怡智俊婷珮婷

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章