当前位置: 开发笔记 > 后端 > 正文

深度学习笔记（15）人的表现

作者：H_debug | 来源：互联网 | 2023-08-11 16:28

深度学习笔记（15）人的表现1.人的表现2.可避免偏差3.理解人的表现4.超过人的表现5.改善模型的表现1.人的表现在过去的几年里，更多

深度学习笔记&＃xff08;15&＃xff09; 人的表现

1. 人的表现
2. 可避免偏差
3. 理解人的表现
4. 超过人的表现
5. 改善模型的表现

1. 人的表现

在过去的几年里&＃xff0c;更多的机器学习团队一直在讨论如何比较机器学习系统和人类的表现
两个主要原因&＃xff1a;

深度学习系统的进步&＃xff0c;在许多机器学习的应用领域已经开始见到算法已经可以威胁到人类的表现了
事实证明&＃xff0c;当试图让机器做人类能做的事情时&＃xff0c;可以精心设计机器学习系统的工作流程&＃xff0c;让工作流程效率更高

所以在这些场合&＃xff0c;比较人类和机器是很自然的&＃xff0c;或者是要让机器模仿人类的行为

在这里插入图片描述
x 轴是时间&＃xff0c;当开始往人类水平努力时&＃xff0c;进展是很快的
但是过了一段时间&＃xff0c;当这个算法表现比人类更好时&＃xff0c;那么进展和精确度的提升就变得更慢了
随着时间的推移
当继续训练算法时&＃xff0c;可能模型越来越大&＃xff0c;数据越来越多
但性能是无法超过某个理论值上限
这就是贝叶斯最优错误率&＃xff08;Bayes optimal error&＃xff09;

贝叶斯最优错误率有时写作Bayesian&＃xff0c;即省略optimal
就是从x到y映射的理论最优函数&＃xff0c;永远不会被超越

所以这紫色线
无论在一个问题上工作多少年&＃xff0c;永远不会超越贝叶斯错误率&＃xff0c;贝叶斯最佳错误率

有两个原因&＃xff0c;为什么当超越人类的表现时&＃xff0c;进展会慢下来

人类水平在很多任务中离贝叶斯最优错误率已经不远了
人们非常擅长看图像&＃xff0c;分辨里面有没有猫或者听写音频
所以&＃xff0c;当超越人类的表现之后也许没有太多的空间继续改善了
一旦超越了人类的表现&＃xff0c;提高性能工具就没那么好用了
对于人类相当擅长的任务&＃xff0c;包括看图识别事物&＃xff0c;听写音频&＃xff0c;或阅读语言
人类一般很擅长处理这些自然数据
对于人类擅长的任务&＃xff0c;只要机器学习算法比人类差&＃xff0c;就可以标记数据
这样就有更多的数据可以喂给学习算法

2. 可避免偏差

用猫分类器来做例子&＃xff0c;比如人类具有近乎完美的准确度&＃xff0c;所以人类水平的错误是1%

在这里插入图片描述
在这种情况下&＃xff0c;如果学习算法达到8%的训练错误率和10%的开发错误率
算法在训练集上的表现和人类水平的表现有很大差距的话
说明算法对训练集的拟合并不好
所以从减少偏差和方差的工具这个角度看&＃xff0c;在这种情况下&＃xff0c;应把重点放在减少偏差上
需要做的是&＃xff0c;比如说训练更大的神经网络&＃xff0c;或者梯度下降久一点

但也许数据集中的图像非常模糊
即使人类都无法判断这张照片中有没有猫&＃xff0c;假设人类水平错误实际上是7.5%
此时系统在训练集上的表现还好&＃xff0c;它只是比人类的表现差一点点&＃xff0c;没有太多改善的空间了
不能继续减少训练错误率了

但训练误差和开发误差之间有更多的改进空间
可以将这个2%的差距缩小一点&＃xff0c;使用减少方差的手段
比如正则化&＃xff0c;或者收集更多的训练数据

贝叶斯错误率或者对贝叶斯错误率的估计和训练错误率之间的差值称为可避免偏差
这理论上是不可能超过贝叶斯错误率的&＃xff0c;除非过拟合

而训练错误率和开发错误率之前的差值
就大概说明算法在方差问题上还有多少改善空间

3. 理解人的表现

在医学图像诊断例子中&＃xff0c;要观察这样的放射科图像并做出分类诊断
在这里插入图片描述

假设普通的人类&＃xff0c;未经训练的人类&＃xff0c;在此任务上达到3%的错误率
普通的医生&＃xff0c;也许是普通的放射科医生&＃xff0c;能达到1%的错误率
经验丰富的医生做得更好&＃xff0c;错误率为0.7%
还有一队经验丰富的医生&＃xff0c;讨论并辩论&＃xff0c;达成共识的意见达到0.5%的错误率

假如系统的训练错误率是5%&＃xff0c;开发错误率是6%&＃xff0c;
可避免偏差大概是2%&＃xff0c;4%&＃xff0c;4.3%&＃xff0c;4.5%&＃xff0c;这明显比都比方差问题1%大
所以在这种情况下&＃xff0c;应该专注于减少偏差的技术&＃xff0c;例如培训更大的网络
所以此时贝叶斯错误率小于等于0.5%&＃xff0c;最优错误率必须在0.5%以下

比如系统的训练错误率是0.7%&＃xff0c;所以你现在已经做得很好了
开发错误率是0.8%&＃xff0c;在这种情况下&＃xff0c;用0.5%来估计贝叶斯错误率关系就很大
因为在这种情况下&＃xff0c;可避免偏差是0.2%&＃xff0c;是方差问题0.1%的两倍
这表明也许偏差和方差都存在问题&＃xff0c;但可避免偏差问题更严重

如果用0.7%代替贝叶斯错误率&＃xff0c;可避免偏差基本上是0%&＃xff0c;那就可能忽略可避免偏差了
实际上应该试试能不能在训练集上做得更好
更好的估计贝叶斯错误率&＃xff0c;可以帮助更好地估计可避免偏差和方差
能够更好的做出减少偏差或减少方差的策略

4. 超过人的表现

一组人类专家充分讨论辩论之后&＃xff0c;达到0.5%的错误率&＃xff0c;单个人类专家错误率是1%
训练出来的算法0.6%的训练错误率&＃xff0c;0.8%的开发错误率
可避免偏差的估计是至少0.1%&＃xff0c;然后方差是0.2%
和减少可避免偏差比较起来&＃xff0c;减少方差可能空间更大

但出来的算法0.3%训练错误率&＃xff0c;还有0.4%开发错误率
这是否意味着过拟合了0.2%&＃xff0c;或者说贝叶斯错误率其实是0.1%呢&＃xff1f;或者也许贝叶斯错误率是0.2%&＃xff1f;
真的不知道
实际上没有足够的信息来判断优化算法时应该专注减少偏差还是减少方差
这样进展效率就会降低

所以要达到超越人类的表现往往不容易
但如果有足够多的数据&＃xff0c;已经有很多深度学习系统&＃xff0c;在单一监督学习问题上已经超越了人类的水平
所以这对开发的应用是有意义的

5. 改善模型的表现

减少可避免偏差的策略&＃xff1a;

规模更大的模型&＃xff0c;这样算法在训练集上的表现会更好
训练更久
更好的优化算法&＃xff0c;比如说加入momentum或者RMSprop
更好的算法&＃xff0c;比如Adam
更好的新神经网络架构&＃xff0c;如循环神经网络和卷积神经网络
更好的超参数
改变激活函数&＃xff0c;改变层数或者隐藏单位数&＃xff0c;虽然这么做可能会让模型规模变大

减少方差的策略&＃xff1a;

收集更多数据&＃xff0c;因为收集更多数据去训练可以更好地推广到系统看不到的开发集数据
尝试正则化&＃xff0c;包括L2正则化&＃xff0c;dropout正则化或者之前提到的数据增强
试用不同的神经网络架构
超参数搜索

参考&＃xff1a;

《神经网络和深度学习》视频课程

推荐阅读

go
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
go
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
python
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
python
机器学习核心概念与技术

本文系统梳理了机器学习的关键知识点，涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容，并深入探讨了各算法的原理和应用场景。 ... [详细]

蜡笔小新 2024-12-22 09:15:30
注入
探索电路与系统的起源与发展

本文回顾了电路与系统的发展历程，从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明，还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]

蜡笔小新 2024-12-24 13:57:05
python
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新 2024-12-24 08:48:32
go
2017年人工智能领域的十大里程碑事件回顾

随着2018年的临近，我们一同回顾过去一年中人工智能领域的重要进展。这一年，无论是政策层面的支持，还是技术上的突破，都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]

蜡笔小新 2024-12-16 17:59:16
go
智慧城市建设现状及未来趋势

随着新基建政策的推进及‘十四五’规划的实施，我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型，促进数字政府建设，新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计，以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]

蜡笔小新 2024-12-16 16:43:21
go
【度量学习】Siamese Network

基于2-channelnetwork的图片相似度判别一、相关理论本篇博文主要讲解2015年CVPR的一篇关于图像相似度计算的文章：《LearningtoCompar ... [详细]

蜡笔小新 2024-12-12 19:11:33
timeout
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
timeout
LambdaMART算法详解

本文详细介绍了LambdaMART算法的背景、原理及其在信息检索中的应用。首先回顾了LambdaMART的发展历程，包括其前身RankNet和LambdaRank，然后深入探讨了LambdaMART如何结合梯度提升决策树（GBDT）和LambdaRank来优化排序问题。 ... [详细]

蜡笔小新 2024-12-18 12:30:35
go
美团推荐系统：机器学习优化重排序模型

在互联网信息爆炸的时代，当用户需求模糊或难以通过精确查询表达时，推荐系统成为解决信息过载的有效手段。美团作为国内领先的O2O平台，通过深入分析用户行为，运用先进的机器学习技术优化推荐算法，提升用户体验。 ... [详细]

蜡笔小新 2024-12-17 17:56:15
go
机器学习公开课备忘录（三）机器学习算法的应用与大数据集

机器学习公开课备忘录（三）机器学习算法的应用与大数据集对应机器学习公开课第六周和第10周机器学习算法模型的选择与评价1、对于一个data，可以将data划分为trainingset、t ... [详细]

蜡笔小新 2024-12-17 15:54:47
go
全能终端工具推荐：高效、免费、易用

介绍一款备受好评的全能型终端工具——MobaXterm，它不仅功能强大，而且完全免费，适合各类用户使用。 ... [详细]

蜡笔小新 2024-12-16 21:02:15
go
黑客如何利用AI在暗网重建你的数字身份

随着技术的发展，黑客开始利用AI技术在暗网中创建用户的‘数字孪生’，这一现象引起了安全专家的高度关注。 ... [详细]

蜡笔小新 2024-12-12 17:45:26

H_debug

Tags | 热门标签

RankList | 热门文章