热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

深度学习笔记(15)人的表现

深度学习笔记(15)人的表现1.人的表现2.可避免偏差3.理解人的表现4.超过人的表现5.改善模型的表现1.人的表现在过去的几年里,更多


深度学习笔记(15) 人的表现

  • 1. 人的表现
  • 2. 可避免偏差
  • 3. 理解人的表现
  • 4. 超过人的表现
  • 5. 改善模型的表现




1. 人的表现

在过去的几年里,更多的机器学习团队一直在讨论如何比较机器学习系统和人类的表现
两个主要原因:


  • 深度学习系统的进步,在许多机器学习的应用领域已经开始见到算法已经可以威胁到人类的表现了
  • 事实证明,当试图让机器做人类能做的事情时,可以精心设计机器学习系统的工作流程,让工作流程效率更高

所以在这些场合,比较人类和机器是很自然的,或者是要让机器模仿人类的行为

在这里插入图片描述
x 轴是时间,当开始往人类水平努力时,进展是很快的
但是过了一段时间,当这个算法表现比人类更好时,那么进展和精确度的提升就变得更慢了
随着时间的推移
当继续训练算法时,可能模型越来越大,数据越来越多
但性能是无法超过某个理论值上限
这就是贝叶斯最优错误率(Bayes optimal error)

贝叶斯最优错误率有时写作Bayesian,即省略optimal
就是从x到y映射的理论最优函数,永远不会被超越

所以这紫色线
无论在一个问题上工作多少年,永远不会超越贝叶斯错误率,贝叶斯最佳错误率

有两个原因,为什么当超越人类的表现时,进展会慢下来


  • 人类水平在很多任务中离贝叶斯最优错误率已经不远了
    人们非常擅长看图像,分辨里面有没有猫或者听写音频
    所以,当超越人类的表现之后也许没有太多的空间继续改善了

  • 一旦超越了人类的表现,提高性能工具就没那么好用了
    对于人类相当擅长的任务,包括看图识别事物,听写音频,或阅读语言
    人类一般很擅长处理这些自然数据
    对于人类擅长的任务,只要机器学习算法比人类差,就可以标记数据
    这样就有更多的数据可以喂给学习算法




2. 可避免偏差

用猫分类器来做例子,比如人类具有近乎完美的准确度,所以人类水平的错误是1%

在这里插入图片描述
在这种情况下,如果学习算法达到8%的训练错误率和10%的开发错误率
算法在训练集上的表现和人类水平的表现有很大差距的话
说明算法对训练集的拟合并不好
所以从减少偏差和方差的工具这个角度看,在这种情况下,应把重点放在减少偏差上
需要做的是,比如说训练更大的神经网络,或者梯度下降久一点

但也许数据集中的图像非常模糊
即使人类都无法判断这张照片中有没有猫,假设人类水平错误实际上是7.5%
此时系统在训练集上的表现还好,它只是比人类的表现差一点点,没有太多改善的空间了
不能继续减少训练错误率了

但训练误差和开发误差之间有更多的改进空间
可以将这个2%的差距缩小一点,使用减少方差的手段
比如正则化,或者收集更多的训练数据

贝叶斯错误率或者对贝叶斯错误率的估计和训练错误率之间的差值称为可避免偏差
这理论上是不可能超过贝叶斯错误率的,除非过拟合

而训练错误率和开发错误率之前的差值
就大概说明算法在方差问题上还有多少改善空间




3. 理解人的表现

在医学图像诊断例子中,要观察这样的放射科图像并做出分类诊断
在这里插入图片描述

假设普通的人类,未经训练的人类,在此任务上达到3%的错误率
普通的医生,也许是普通的放射科医生,能达到1%的错误率
经验丰富的医生做得更好,错误率为0.7%
还有一队经验丰富的医生,讨论并辩论,达成共识的意见达到0.5%的错误率

假如系统的训练错误率是5%,开发错误率是6%,
可避免偏差大概是2%,4%,4.3%,4.5%,这明显比都比方差问题1%大
所以在这种情况下,应该专注于减少偏差的技术,例如培训更大的网络
所以此时贝叶斯错误率小于等于0.5%,最优错误率必须在0.5%以下

比如系统的训练错误率是0.7%,所以你现在已经做得很好了
开发错误率是0.8%,在这种情况下,用0.5%来估计贝叶斯错误率关系就很大
因为在这种情况下,可避免偏差是0.2%,是方差问题0.1%的两倍
这表明也许偏差和方差都存在问题,但可避免偏差问题更严重

如果用0.7%代替贝叶斯错误率,可避免偏差基本上是0%,那就可能忽略可避免偏差了
实际上应该试试能不能在训练集上做得更好
更好的估计贝叶斯错误率,可以帮助更好地估计可避免偏差和方差
能够更好的做出减少偏差或减少方差的策略




4. 超过人的表现

一组人类专家充分讨论辩论之后,达到0.5%的错误率,单个人类专家错误率是1%
训练出来的算法0.6%的训练错误率,0.8%的开发错误率
可避免偏差的估计是至少0.1%,然后方差是0.2%
和减少可避免偏差比较起来,减少方差可能空间更大

但出来的算法0.3%训练错误率,还有0.4%开发错误率
这是否意味着过拟合了0.2%,或者说贝叶斯错误率其实是0.1%呢?或者也许贝叶斯错误率是0.2%?
真的不知道
实际上没有足够的信息来判断优化算法时应该专注减少偏差还是减少方差
这样进展效率就会降低

所以要达到超越人类的表现往往不容易
但如果有足够多的数据,已经有很多深度学习系统,在单一监督学习问题上已经超越了人类的水平
所以这对开发的应用是有意义的




5. 改善模型的表现

减少可避免偏差的策略:


  • 规模更大的模型,这样算法在训练集上的表现会更好
  • 训练更久
  • 更好的优化算法,比如说加入momentum或者RMSprop
  • 更好的算法,比如Adam
  • 更好的新神经网络架构,如循环神经网络和卷积神经网络
  • 更好的超参数
  • 改变激活函数,改变层数或者隐藏单位数,虽然这么做可能会让模型规模变大

减少方差的策略:


  • 收集更多数据,因为收集更多数据去训练可以更好地推广到系统看不到的开发集数据
  • 尝试正则化,包括L2正则化,dropout正则化或者之前提到的数据增强
  • 试用不同的神经网络架构
  • 超参数搜索


参考:

《神经网络和深度学习》视频课程



相关推荐:

深度学习笔记(14) 评估指标
深度学习笔记(13) Softmax分类
深度学习笔记(12) Batch归一化网络
深度学习笔记(11) 超参数调试
深度学习笔记(10) 优化算法(二)



谢谢!


推荐阅读
  • 2019年斯坦福大学CS224n课程笔记:深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析
    本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理(NLP)领域的应用,重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析,深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • AI TIME联合2021世界人工智能大会,共探图神经网络与认知智能前沿话题
    AI TIME携手2021世界人工智能大会,共同探讨图神经网络与认知智能的最新进展。自2018年在上海首次举办以来,WAIC已成为全球AI领域的年度盛会,吸引了众多专家学者和行业领袖参与。本次大会将聚焦图神经网络在复杂系统建模、知识图谱构建及认知智能应用等方面的技术突破和未来趋势。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 为了评估精心优化的模型与策略在实际环境中的表现,Google对其实验框架进行了全面升级,旨在实现更高效、更精准和更快速的在线测试。新的框架支持更多的实验场景,提供更好的数据洞察,并显著缩短了实验周期,从而加速产品迭代和优化过程。 ... [详细]
  • Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性,但Python作为一种通用编程语言,适用于更广泛的领域,包括Web开发、自动化脚本和机器学习等。对于初学者而言,Python的学习曲线更为平缓,上手更加容易。此外,Python拥有庞大的社区支持和丰富的第三方库,使其在实际应用中更具灵活性和扩展性。 ... [详细]
  • 理工科男女不容错过的神奇资源网站
    十一长假即将结束,你的假期学习计划进展如何?无论你是在家中、思念家乡,还是身处异国他乡,理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档,能够帮助你在假期中高效学习和提升专业技能。 ... [详细]
  • 超分辨率技术的全球研究进展与应用现状综述
    本文综述了图像超分辨率(Super-Resolution, SR)技术在全球范围内的最新研究进展及其应用现状。超分辨率技术旨在从单幅或多幅低分辨率(Low-Resolution, LR)图像中恢复出高质量的高分辨率(High-Resolution, HR)图像。该技术在遥感、医疗成像、视频处理等多个领域展现出广泛的应用前景。文章详细分析了当前主流的超分辨率算法,包括基于传统方法和深度学习的方法,并探讨了其在实际应用中的优缺点及未来发展方向。 ... [详细]
  • 深入浅出解读奇异值分解,助你轻松掌握核心概念 ... [详细]
  • 字节跳动深圳研发中心安全业务团队正在火热招募人才! ... [详细]
  • 浅层神经网络解析:本文详细探讨了两层神经网络(即一个输入层、一个隐藏层和一个输出层)的结构与工作原理。通过吴恩达教授的课程,读者将深入了解浅层神经网络的基本概念、参数初始化方法以及前向传播和反向传播的具体实现步骤。此外,文章还介绍了如何利用这些基础知识解决实际问题,并提供了丰富的实例和代码示例。 ... [详细]
  • 掌握PHP框架开发与应用的核心知识点:构建高效PHP框架所需的技术与能力综述
    掌握PHP框架开发与应用的核心知识点对于构建高效PHP框架至关重要。本文综述了开发PHP框架所需的关键技术和能力,包括但不限于对PHP语言的深入理解、设计模式的应用、数据库操作、安全性措施以及性能优化等方面。对于初学者而言,熟悉主流框架如Laravel、Symfony等的实际应用场景,有助于更好地理解和掌握自定义框架开发的精髓。 ... [详细]
  • 表面缺陷检测数据集综述及GitHub开源项目推荐
    本文综述了表面缺陷检测领域的数据集,并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理,为研究人员提供了全面的资源参考,有助于推动该领域的发展和技术进步。 ... [详细]
  • 特征工程入门指南:开启数据科学之旅
    本文首次发布于“计算机视觉CV”微信公众号,旨在介绍特征工程的基础知识,引领读者步入数据科学领域。特征工程是机器学习流程中的关键步骤,它涉及将原始数据转换为能够更好地反映潜在问题结构的特征,从而提升模型的预测性能。通过精心设计的特征,机器学习算法能够更有效地从数据中提取有价值的信息,进而生成准确的预测或结论。 ... [详细]
author-avatar
H_debug
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有