当前位置: 开发笔记 > 程序员 > 正文

验证集精确度和损失同时上升

作者：XL | 来源：互联网 | 2023-06-03 12:40

目录1.实验结果2.分析1.实验结果下图中val_acc，val_loss分别表示验证集精确度和损失；train_acc，train_lo

1. 实验结果

下图中val_acc&＃xff0c;val_loss分别表示验证集精确度和损失&＃xff1b;train_acc&＃xff0c;train_loss分别表示训练集精确度和损失。验证集精确度一直上升&＃xff0c;但是损失在第六个epoch后也开始上升&＃xff0c;如何解释&＃xff1f;
在这里插入图片描述

2. 分析

在N标签分类任务中&＃xff0c;输出是一个N维的向量&＃xff0c;向量中每个位置代表某类标签&＃xff0c;其值代表属于此类标签的概率值。我们取概率最大值的索引所对应的标签作为最终预测标签&＃xff0c;所以最大概率其相对值更重要&＃xff0c;90%的概率和50%的概率是等价的&＃xff0c;只要它是最大概率即可&＃xff0c;但是90%所对应的损失要小于50%对应的损失。因此只要正确类别的预测概率最大&＃xff0c;它就可以在val-loss增加时仍然保持比较平稳的状态。

下面通过一个例子说明&＃xff1a;

假设现在有2个类别的数据集&＃xff0c;类别分别是dog和horse&＃xff0c;对于现在的一个样本&＃xff0c;其真实类别是horse&＃xff0c;也就是其真实值one-hot为[0, 1]&＃xff0c;对于下面2种情况&＃xff1a;
①其预测softmax值为[0.1, 0.9]&＃xff0c;则对于这个例子的交叉熵值计算为&＃xff1a;
$- (0 * l n 0.1 &＃43; 1 * l n 0.9) \approx 0.105$
②其预测softmax值为[0.4, 0.6]&＃xff0c;则对于这个例子的交叉熵值计算为&＃xff1a;
$- (0 * l n 0.4 &＃43; 1 * l n 0.6) \approx 0.511$
也就是说&＃xff0c;虽然在上述两种情况下&＃xff0c;预测值都为horse&＃xff0c;即其accuracy是一样的&＃xff0c;但是其loss是增加的。这种情况下就会出现val-loss不断增加&＃xff0c;但是val-accuracy平稳不变的情况。
同理&＃xff0c;在若干个样本的加和val-loss中&＃xff0c;可能出现val-accuracy缓慢上升&＃xff0c;val-loss也上升的情况&＃xff0c;这种情况也属于过拟合问题&＃xff0c;在这种情况下&＃xff0c;可能预测softmax值稍微发现一点点的变化&＃xff0c;使得accuracy上升&＃xff0c;但是因为有其他样本的loss增加的较多&＃xff0c;所以即使对于当前这样样本来说&＃xff0c;acc增加&＃xff0c;loss减少&＃xff0c;但是对于整体样本的loss和来说&＃xff0c;loss增加&＃xff0c;造成整体情况是acc增加&＃xff0c;loss也在增加。

实验表明&＃xff0c;在数据量不是很大的情况下&＃xff0c;的确会出现上述问题&＃xff0c;但是如果数据量足够大&＃xff0c;最终趋于的平稳情况是loss增加&＃xff0c;acc会降低。这也就引出了为什么在训练网络的衡量指标中&＃xff0c;loss比accuracy更常用&＃xff0c;总结如下&＃xff1a;
(1) loss函数是可微的&＃xff0c;而accuracy不是可微的&＃xff0c;在网络模型反向传播过程中&＃xff0c;需要可微的目标函数。
(2) 在分类任务中&＃xff0c;使用accuracy可以&＃xff0c;但是在回归任务中&＃xff0c;accuracy便不再可用&＃xff0c;只能使用loss
(3) 损失函数可以有多种优化方法&＃xff0c;如牛顿法、极大似然估计等

参考&＃xff1a;
https://blog.csdn.net/quiet_girl/article/details/86138489

https

推荐阅读

开发者
QBlog开源博客系统：Page_Load生命周期与参数传递优化（第四部分）

本教程将深入探讨QBlog开源博客系统的Page_Load生命周期，并介绍一种简洁的参数传递重构方法。通过视频演示和详细讲解，帮助开发者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-12-28 10:39:53
excel
SQL中UPDATE SET FROM语句的使用方法及应用场景

本文详细介绍了SQL中UPDATE SET FROM语句的使用方法，通过具体示例展示了如何利用该语句高效地更新多表关联数据。适合数据库管理员和开发人员参考。 ... [详细]

蜡笔小新 2024-12-28 10:22:16
编程
python的交互模式怎么输出名文汉字[python常见问题]

在命令行模式下敲命令python，就看到类似如下的一堆文本输出，然后就进入到Python交互模式，它的提示符是>>>，此时我们可以使用print() ... [详细]

蜡笔小新 2024-12-27 21:32:05
push
火星商店问题：线段树分治与持久化Trie树的应用

本题涉及编号为1至n的火星商店，每个商店有一个永久商品价值v。操作包括每天在指定商店增加一个新商品，以及查询某段时间内某些商店中所有商品（含永久商品）与给定密码值的最大异或结果。通过线段树分治和持久化Trie树来高效解决此问题。 ... [详细]

蜡笔小新 2024-12-27 21:23:11
push
Java 中的 BigDecimal pow()方法，示例

Java 中的 BigDecimal pow()方法，示例 ... [详细]

蜡笔小新 2024-12-27 20:54:03
push
汇编语言高级特性总结

本文总结了汇编语言中第五至第八章的关键知识点，涵盖间接寻址、指令格式、安全编程空间、逻辑运算指令及数据重复定义等内容。通过详细解析这些内容，帮助读者更好地理解和应用汇编语言的高级特性。 ... [详细]

蜡笔小新 2024-12-27 19:52:28
push
FastJSON解析与数据提取技巧

探讨如何高效使用FastJSON进行JSON数据解析，特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]

蜡笔小新 2024-12-27 19:49:07
编程
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
编程
Maven多模块项目管理最佳实践

本文详细介绍了如何使用Maven高效管理多模块项目，涵盖项目结构设计、依赖管理和构建优化等方面。通过具体的实例和配置说明，帮助开发者更好地理解和应用Maven在复杂项目中的优势。 ... [详细]

蜡笔小新 2024-12-27 19:29:15
编程
路由器配置与网络地址转换

本文介绍了如何在具备多个IP地址的FTP服务器环境中，通过动态地址端口复用和地址转换技术优化网络配置。重点讨论了2Mb/s DDN专线连接、Cisco 2611路由器及内部网络地址规划。 ... [详细]

蜡笔小新 2024-12-27 18:25:35
编程
深入理解Cookie与Session会话管理

本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息，以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制，解释其原理及应用场景。 ... [详细]

蜡笔小新 2024-12-27 18:20:43
编程
解决 Python 项目中 setuptools_rust 模块缺失问题

本文介绍了在安装或运行 Python 项目时遇到的 'ModuleNotFoundError: No module named setuptools_rust' 错误，并提供了解决方案。 ... [详细]

蜡笔小新 2024-12-27 18:06:18
编译
CentOS7源码编译安装MySQL5.6

2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网：https:www.cmake.org如此时最新 ... [详细]

蜡笔小新 2024-12-27 17:49:56
编译
构建基于BERT的中文NL2SQL模型：一个简明的基准

本文探讨了将自然语言转换为SQL语句（NL2SQL）的任务，这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践，该比赛提供了金融和通用领域的表格数据，并标注了对应的自然语言与SQL语句对，旨在训练准确的NL2SQL模型。 ... [详细]

蜡笔小新 2024-12-27 17:36:19
编程
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章