热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

CV北邮鲁鹏老师全连接神经网络(下)learningdialog(6)

https:www.bilibili.comvideoBV1V54y1B7K3?p6https:www.bilibili.comvideoBV1V54y1B7K3?p6https:

https://www.bilibili.com/video/BV1V54y1B7K3?p=6https://www.bilibili.com/video/BV1V54y1B7K3?p=6icon-default.png?t=L9C2https://www.bilibili.com/video/BV1V54y1B7K3?p=6

回顾:

基于动量法的GD:注意他是直接改变梯度值 g = f(g)

        减少震荡:震荡的时候梯度是正负值依次出现,因此用上一次的梯度值来抵消这一次的梯度

        加速平坦:累加

基于自适应思想的GD:这种方法没有利用震荡时梯度正负值交替出现的特点,而是利用平方运算(平方梯度)放  大梯度的大小,改造学习率,从而达到有效梯度下降的目的

关于loss

(1)一般的loss计算

(2)带正则损失的loss计算

(3)softmax交叉熵

过拟合与欠拟合

overfit:参数过多,过于复杂的模型掩盖了真正重要的参数,相当于只是牢牢记住训练集。比如说学习识别猫,有些图像猫只有三只脚,模型就记住了这一点

underfit:参数过少,没有触及到多数真正重要的参数

总的来说,两者都没能很好地学习到数据特征

由此,ML的根本问题就是模型的优化和泛化

 大框可以叫训练前期,小框可以叫训练后期

处理overfit

最优方案:增加数据集。比如说获取全世界所有的猫图片

次优方案:1.缩小网络  2.增加正则损失,因为他使模型朝向权值分散修正,尽量使用所有特征

                  3.随即失活,丢弃学习。一方面缩小了网络,一方面间接起到了分散权值的作用 ,最后可以看作多个小网络的集成

随机失活的评估

假设dropout = 0.5,可以计算出训练阶段输出层某个神经元的期望,比较测试阶段该神经元的期望,就会发现两者不匹配,需要乘上一个dropout

那么我们就设置一个dropout层,在做随机失活的同时先除掉这个dropout.

dropout层的计算不是按照矩阵乘法的规则,而是按位相乘

超参数调优

法一:排列组合,网格法

法二:随机搜索。感觉上还是要在跟网格法一样的取值范围内

 

如何进行随机搜索?

1.粗搜索。在较大范围内采样,训练一个周期,选择验证集正确率小的范围

2.精搜索:在上步骤训练5-10个周期,选择在验证机上精度最高的 

搜索的范围如何确定?超参数的标尺空间?

这个值要涉及到不同量级,所以是在log空间中选取

 


推荐阅读
  • 2019年斯坦福大学CS224n课程笔记:深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析
    本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理(NLP)领域的应用,重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析,深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]
  • 技术日志:使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告
    技术日志:使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告 ... [详细]
  • 计算机视觉领域介绍 | 自然语言驱动的跨模态行人重识别前沿技术综述(上篇)
    本文介绍了计算机视觉领域的最新进展,特别是自然语言驱动的跨模态行人重识别技术。上篇内容详细探讨了该领域的基础理论、关键技术及当前的研究热点,为读者提供了全面的概述。 ... [详细]
  • 在前文探讨了Spring如何为特定的bean选择合适的通知器后,本文将进一步深入分析Spring AOP框架中代理对象的生成机制。具体而言,我们将详细解析如何通过代理技术将通知器(Advisor)中包含的通知(Advice)应用到目标bean上,以实现切面编程的核心功能。 ... [详细]
  • 深入解析经典卷积神经网络及其实现代码
    深入解析经典卷积神经网络及其实现代码 ... [详细]
  • Android目录遍历工具 | AppCrawler自动化测试进阶(第二部分):个性化配置详解
    终于迎来了“足不出户也能为社会贡献力量”的时刻,但有追求的测试工程师绝不会让自己的生活变得乏味。与其在家消磨时光,不如利用这段时间深入研究和提升自己的技术能力,特别是对AppCrawler自动化测试工具的个性化配置进行详细探索。这不仅能够提高测试效率,还能为项目带来更多的价值。 ... [详细]
  • 在开发过程中,我最初也依赖于功能全面但操作繁琐的集成开发环境(IDE),如Borland Delphi 和 Microsoft Visual Studio。然而,随着对高效开发的追求,我逐渐转向了更加轻量级和灵活的工具组合。通过 CLIfe,我构建了一个高度定制化的开发环境,不仅提高了代码编写效率,还简化了项目管理流程。这一配置结合了多种强大的命令行工具和插件,使我在日常开发中能够更加得心应手。 ... [详细]
  • REST与RPC:选择哪种API架构风格?
    在探讨REST与RPC这两种API架构风格的选择时,本文首先介绍了RPC(远程过程调用)的概念。RPC允许客户端通过网络调用远程服务器上的函数或方法,从而实现分布式系统的功能调用。相比之下,REST(Representational State Transfer)则基于资源的交互模型,通过HTTP协议进行数据传输和操作。本文将详细分析两种架构风格的特点、适用场景及其优缺点,帮助开发者根据具体需求做出合适的选择。 ... [详细]
  • 尽管我们尽最大努力,任何软件开发过程中都难免会出现缺陷。为了更有效地提升对支持部门的协助与支撑,本文探讨了多种策略和最佳实践,旨在通过改进沟通、增强培训和支持流程来减少这些缺陷的影响,并提高整体服务质量和客户满意度。 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 掌握PHP编程必备知识与技巧——全面教程在当今的PHP开发中,了解并运用最新的技术和最佳实践至关重要。本教程将详细介绍PHP编程的核心知识与实用技巧。首先,确保你正在使用PHP 5.3或更高版本,最好是最新版本,以充分利用其性能优化和新特性。此外,我们还将探讨代码结构、安全性和性能优化等方面的内容,帮助你成为一名更高效的PHP开发者。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • 本文详细介绍了如何在 Grafana 中独立于 Alertmanager 配置邮件和微信告警。具体步骤包括配置 SMTP 服务器以实现邮件告警,以及设置微信告警的集成方式。通过这些配置,用户可以更灵活地管理和接收来自 Grafana 的告警通知,确保及时响应系统异常。文章还提供了详细的配置示例和常见问题的解决方案,帮助用户顺利完成设置。 ... [详细]
  • 掌握PHP框架开发与应用的核心知识点:构建高效PHP框架所需的技术与能力综述
    掌握PHP框架开发与应用的核心知识点对于构建高效PHP框架至关重要。本文综述了开发PHP框架所需的关键技术和能力,包括但不限于对PHP语言的深入理解、设计模式的应用、数据库操作、安全性措施以及性能优化等方面。对于初学者而言,熟悉主流框架如Laravel、Symfony等的实际应用场景,有助于更好地理解和掌握自定义框架开发的精髓。 ... [详细]
  • 【Python爬虫实操】 不创作小说,专精网站内容迁移,超高效!(含源代码)
    本文详细介绍了如何利用Python爬虫技术实现高效网站内容迁移,涵盖前端、后端及Android相关知识点。通过具体实例和源代码,展示了如何精准抓取并迁移网站内容,适合对Python爬虫实战感兴趣的开发者参考。 ... [详细]
author-avatar
爱文小宝的贇
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有