当前位置: 开发笔记 > 后端 > 正文

[DeeplearningAI笔记]第二章1.11.3偏差/方差/欠拟合/过拟合/训练集/验证集/测试集

作者：僾过以后 | 来源：互联网 | 2023-07-17 20:36

[DeeplearningAI笔记]第二章1.1-1.3偏差方差欠拟合过拟合训练集验证集测试集觉得有用的话,欢迎一起讨论相互学习~吴恩达老师课程原地址1.1训练开发测试集对于一个

[DeeplearningAI笔记]第二章1.1-1.3偏差/方差/欠拟合/过拟合/训练集/验证集/测试集

觉得有用的话,欢迎一起讨论相互学习~

在这里插入图片描述

这就是high bias的情况.

过拟合

"过拟合(overfitting)"如果我们拟合一个非常复杂的分类器,比如深度神经网络或者含有隐藏神经的神经网络,可能就非常适用于这个数据集,但是这看起来不是一种很好的拟合方式,分类器方差较高,数据过度拟合

在这里插入图片描述

适度拟合

复杂程度适中,数据拟合适度的分类器,数据拟合程度相对合理,我们称之为"适度拟合"是介于过拟合和欠拟合中间的一类.

在这里插入图片描述

在这样一个只有x1和x2两个特征的二维数据集中,我们可以绘制数据,将偏差和方差可视化.但是在高维空间数据中,会直属局和可视化分割边界无法实现.但我们可以通过几个指标来研究偏差和方差.

高方差高偏差

高偏差指的是无法很好的拟合数据,高偏差指的是数据拟合灵活性过高,曲线过于灵活但是还包含有过度拟合的错误数据.

在这里插入图片描述

通过验证集/训练集判断拟合

"过拟合":训练集中错误率很低,但是验证集中错误率比验证集中高很多.方差很大.

"欠拟合":训练集中错误率相对比较高,但是验证集的错误率和训练集中错误率差别不大.偏差很大.

偏差和方差都很大: 如果训练集得到的错误率较大,表示不能很好的拟合数据,同时验证集上的错误率甚至更高,表示不能很好的验证算法.这是偏差和方差都很大的情况.

较好的情况: 训练集和验证集上的错误率都很低,并且验证集上的错误率和训练集上的错误率十分接近.

在这里插入图片描述

以上分析的前提都是假设基本误差很小,训练集和验证集数据来自相同分布,如果没有这些前提,分析结果会更加的复杂.

1.3 参数调节基本方法

初始训练完成后,首先看算法的偏差高不高,如果偏差过高,试着评估训练集或训练数据的性能.如果偏差真的很大,甚至无法拟合数据,现在就要选择一个新的网络.比如有更多隐层或者隐藏单元的网络.或者花费更多时间训练算法或者尝试更先进的优化算法.(ps:一般来讲,采用规模更大的网络通常会有帮助,延长训练时间不一定有用,但是也没有坏处,训练学习算法时,会不断尝试这些方法,知道解决掉偏差问题,这是最低标准,通常如果网络足够大,一般可以很好的拟合训练集)
一旦训练集上的偏差降低到一定的水平,可以检查一下方差有没有问题.为了评估方差我们要查看验证集性能.如果验证集和训练集的错误率误差较大即方差较大,最好的方法是采用更多数据.如果不能收集到更多的数据,我们可以采用正则化来减少过拟合.
我们需要选择正确的方法,不断迭代改进,如果是偏差本身比较大,准备更多的训练数据也没有什么用,所以一定要看清是哪方面出了问题.一般来讲选择正确的方法,使用更大更深的网络,更多的数据可以得到很好的效果

推荐阅读

正则
弱监督目标检测之一最小熵隐变量模型

目标检测是计算机视觉一个非常重要的子任务。目标检测需要发现并准确定位自然图片中的物体。在2012年之前，目标检测主要基于手工设计的特征以及传统分类器。2012年以后，出现了 ... [详细]

蜡笔小新 2024-10-20 17:50:44
正则
基于TensorFlow的鸢尾花数据集神经网络模型深度解析

基于TensorFlow的鸢尾花数据集神经网络模型深度解析 ... [详细]

蜡笔小新 2024-10-22 11:56:51
ftp
TensorFlow基础知识深化讲解

批标准化批标准化（batchnormalization,BN）是为了克服神经网络层数加深导致难以训练而诞生的。深度神经网络随着深度加深，收 ... [详细]

蜡笔小新 2024-10-22 10:19:31
ftp
深入解析人工神经网络中的神经元模型

目前，深度学习（DeepLearning，简称DL）在算法领域可谓是大红大紫，现在不只是互联网、人工智能，生活中的各大领域都能反映出深度学习引领的巨大变革。要学习深度学习，那么首先 ... [详细]

蜡笔小新 2024-10-22 07:28:10
漏洞
信息安全工程师五天修炼（第五章 5.4安全设备）

第五章5.4安全设备防火墙防火墙是网络关联的重要设备，用于控制网络之间的语言。外部网络用户的访问必须先经过安全策略过滤，而内部网络用户对外部网络的访 ... [详细]

蜡笔小新 2024-10-21 13:09:14
漏洞
Yolov3代码分析与训练自己数据集

现在要针对我们需求引入检测模型，只检测人物，然后是图像能侧立，这样人物在里面占比更多，也更清晰，也不需要检测人占比小的情况，如下是针对这个需求，用的yolov3-tiny模型训练后 ... [详细]

蜡笔小新 2024-10-20 12:34:58
漏洞
深度学习分位数回归实现区间预测

深度学习分位数回归实现区间预测 ... [详细]

蜡笔小新 2024-10-19 11:37:08
h2
深度学习: 目标函数

Introduction目标函数是深度学习之心，是模型训练的发动机。目标函数(objectfunction)损失函数(lossfunction)代价函数(costfunction) ... [详细]

蜡笔小新 2024-10-18 18:45:28
h2
CSWS_E_ROB深度估计方法

论文链接：https:arxiv.orgpdf1708.02287.pdf正文翻译概述……首先，我们把深度估计看做一种多类别的密集标记任务，然后与基于公式的 ... [详细]

蜡笔小新 2024-10-17 00:38:56
h2
玩转Koa koarouter道理剖析

一、媒介 Koa为了坚持本身的简约，并没有绑缚中间件。然则在现实的开辟中，我们须要和五花八门的中间件打交道，本文将要剖析的是常常用到的路由中间件—koa-router。假如你 ... [详细]

蜡笔小新 2024-10-21 18:53:32
h2
算法正则表达式匹配详解编程语言

*[正则表达式匹配] [题目]请实现一个函数用来匹配包括'.'和'*'的正则表达式。模式中的字符'.'表示 ... [详细]

蜡笔小新 2024-10-21 13:32:22
h2
第三届人工智能、网络与信息技术国际学术会议（AINIT 2022)

20223rdInternationalSeminaronArtificialIntelligence,NetworkingandInformationTechnology第三届 ... [详细]

蜡笔小新 2024-10-21 09:26:13
h2
MATLAB人体行为检测与识别

人体行为检测与识别摘要人体行为检测与识别是当前研究的重点，具有很高的研究价值和广阔的应用前景。主要应用在型人机交互、运动分析、智能监控和虚拟现实也称灵境技术ÿ ... [详细]

蜡笔小新 2024-10-20 19:34:31
h2
谁是AI界大坑，景观设计师是否比建筑师更不容易被AI所取代？

来源：源于中国的现代景观研究平台本文已获授权当下，风景园林或景观设计行业不能只在自己的小圈子讨论设计好或不好，而是应该跨出舒适区，与不同的行业交流切磋。笔者一直对AI充满关注。认为 ... [详细]

蜡笔小新 2024-10-20 13:41:47
h2
我在滴滴数据分析岗实习8个月的收获（文末附内推机会）

我在滴滴数据分析岗实习8个月的收获（文末附内推机会）作者：海潮来源：数据管道大家好，我是宝器！今天分享一下交流群里海潮兄弟的「数据分析岗」求职与工作经验，以下是海潮兄弟的自诉，全文 ... [详细]

蜡笔小新 2024-10-18 11:57:45

僾过以后

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章