热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

CV北邮鲁鹏老师全连接神经网络(下)learningdialog(6)

https:www.bilibili.comvideoBV1V54y1B7K3?p6https:www.bilibili.comvideoBV1V54y1B7K3?p6https:

https://www.bilibili.com/video/BV1V54y1B7K3?p=6https://www.bilibili.com/video/BV1V54y1B7K3?p=6icon-default.png?t=L9C2https://www.bilibili.com/video/BV1V54y1B7K3?p=6

回顾:

基于动量法的GD:注意他是直接改变梯度值 g = f(g)

        减少震荡:震荡的时候梯度是正负值依次出现,因此用上一次的梯度值来抵消这一次的梯度

        加速平坦:累加

基于自适应思想的GD:这种方法没有利用震荡时梯度正负值交替出现的特点,而是利用平方运算(平方梯度)放  大梯度的大小,改造学习率,从而达到有效梯度下降的目的

关于loss

(1)一般的loss计算

(2)带正则损失的loss计算

(3)softmax交叉熵

过拟合与欠拟合

overfit:参数过多,过于复杂的模型掩盖了真正重要的参数,相当于只是牢牢记住训练集。比如说学习识别猫,有些图像猫只有三只脚,模型就记住了这一点

underfit:参数过少,没有触及到多数真正重要的参数

总的来说,两者都没能很好地学习到数据特征

由此,ML的根本问题就是模型的优化和泛化

 大框可以叫训练前期,小框可以叫训练后期

处理overfit

最优方案:增加数据集。比如说获取全世界所有的猫图片

次优方案:1.缩小网络  2.增加正则损失,因为他使模型朝向权值分散修正,尽量使用所有特征

                  3.随即失活,丢弃学习。一方面缩小了网络,一方面间接起到了分散权值的作用 ,最后可以看作多个小网络的集成

随机失活的评估

假设dropout = 0.5,可以计算出训练阶段输出层某个神经元的期望,比较测试阶段该神经元的期望,就会发现两者不匹配,需要乘上一个dropout

那么我们就设置一个dropout层,在做随机失活的同时先除掉这个dropout.

dropout层的计算不是按照矩阵乘法的规则,而是按位相乘

超参数调优

法一:排列组合,网格法

法二:随机搜索。感觉上还是要在跟网格法一样的取值范围内

 

如何进行随机搜索?

1.粗搜索。在较大范围内采样,训练一个周期,选择验证集正确率小的范围

2.精搜索:在上步骤训练5-10个周期,选择在验证机上精度最高的 

搜索的范围如何确定?超参数的标尺空间?

这个值要涉及到不同量级,所以是在log空间中选取

 


推荐阅读
  • 本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用,涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]
  • 利用Java与Tesseract-OCR实现数字识别
    本文深入探讨了如何利用Java语言结合Tesseract-OCR技术来实现图像中的数字识别功能,旨在为开发者提供详细的指导和实践案例。 ... [详细]
  • 回顾与学习是进步的阶梯。再次审视卷积神经网络(CNNs),我对之前不甚明了的概念有了更深的理解。本文旨在分享这些新的见解,并探讨CNNs在图像识别和自然语言处理等领域中的实际应用。 ... [详细]
  • 资源推荐 | TensorFlow官方中文教程助力英语非母语者学习
    来源:机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南,帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • Coursera ML 机器学习
    2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]
  • Android Studio 中 Activity 组件详解
    本文介绍了 Android 开发中 Activity 的基本概念、生命周期、状态转换以及如何创建和管理 Activity。通过详细的解释和示例代码,帮助开发者更好地理解和使用 Activity。 ... [详细]
  • 基于2-channelnetwork的图片相似度判别一、相关理论本篇博文主要讲解2015年CVPR的一篇关于图像相似度计算的文章:《LearningtoCompar ... [详细]
  • 利用HTML5 Canvas高效构建电信网络拓扑图
    电信网络拓扑图在实际应用中具有很高的实用价值。本文介绍了一个基于HTML5 Canvas的电信网络拓扑图项目,不仅实现了基本的图形展示功能,还加入了自动布局和属性栏功能,使项目更加完善。此Demo经过细微调整即可直接应用于实际项目中。 ... [详细]
  • 大数据时代的机器学习:人工特征工程与线性模型的局限
    本文探讨了在大数据背景下,人工特征工程与线性模型的应用及其局限性。随着数据量的激增和技术的进步,传统的特征工程方法面临挑战,文章提出了未来发展的可能方向。 ... [详细]
  • 本文详细探讨了如何在 C# 中使用 Infragistics 组件库解决常见的开发问题,包括工具栏按钮禁用、Grid 中的时间记录及样式设置、以及 Excel 导出功能的实现。 ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • 数据库内核开发入门 | 搭建研发环境的初步指南
    本课程将带你从零开始,逐步掌握数据库内核开发的基础知识和实践技能,重点介绍如何搭建OceanBase的开发环境。 ... [详细]
  • 本文介绍了基于Java的汽车租赁系统开发,涵盖了从车辆采购预算到车辆维护的全过程管理。该系统利用现代互联网技术和数据库技术,实现了汽车租赁行业的全面信息化。 ... [详细]
  • 本文探讨了在一个工程中如何有效地关联从另一个工程导入的CPP和H文件及其对应的RC资源文件中的对话框资源,特别是如何确保这些资源在类向导中正确显示。 ... [详细]
author-avatar
爱文小宝的贇
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有