热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

验证集精确度和损失同时上升

目录1.实验结果2.分析1.实验结果下图中val_acc,val_loss分别表示验证集精确度和损失;train_acc,train_lo


目录

  • 1. 实验结果
  • 2. 分析


1. 实验结果

  下图中val_acc,val_loss分别表示验证集精确度和损失;train_acc,train_loss分别表示训练集精确度和损失。验证集精确度一直上升,但是损失在第六个epoch后也开始上升,如何解释?
在这里插入图片描述在这里插入图片描述


2. 分析

  在N标签分类任务中,输出是一个N维的向量,向量中每个位置代表某类标签,其值代表属于此类标签的概率值。我们取概率最大值的索引所对应的标签作为最终预测标签,所以最大概率其相对值更重要,90%的概率和50%的概率是等价的,只要它是最大概率即可,但是90%所对应的损失要小于50%对应的损失。因此只要正确类别的预测概率最大,它就可以在val-loss增加时仍然保持比较平稳的状态。

  下面通过一个例子说明:

  假设现在有2个类别的数据集,类别分别是dog和horse,对于现在的一个样本,其真实类别是horse,也就是其真实值one-hot为[0, 1],对于下面2种情况:
①其预测softmax值为[0.1, 0.9],则对于这个例子的交叉熵值计算为:
−(0∗ln0.1+1∗ln0.9)≈0.105-(0*ln0.1+1*ln0.9) ≈ 0.105(0ln0.1+1ln0.9)0.105
②其预测softmax值为[0.4, 0.6],则对于这个例子的交叉熵值计算为:
−(0∗ln0.4+1∗ln0.6)≈0.511-(0*ln0.4+1*ln0.6) ≈0.511(0ln0.4+1ln0.6)0.511
  也就是说,虽然在上述两种情况下,预测值都为horse,即其accuracy是一样的,但是其loss是增加的。这种情况下就会出现val-loss不断增加,但是val-accuracy平稳不变的情况。
同理,在若干个样本的加和val-loss中,可能出现val-accuracy缓慢上升,val-loss也上升的情况,这种情况也属于过拟合问题,在这种情况下,可能预测softmax值稍微发现一点点的变化,使得accuracy上升,但是因为有其他样本的loss增加的较多,所以即使对于当前这样样本来说,acc增加,loss减少,但是对于整体样本的loss和来说,loss增加,造成整体情况是acc增加,loss也在增加。

  实验表明,在数据量不是很大的情况下,的确会出现上述问题,但是如果数据量足够大,最终趋于的平稳情况是loss增加,acc会降低。这也就引出了为什么在训练网络的衡量指标中,loss比accuracy更常用,总结如下:
  (1) loss函数是可微的,而accuracy不是可微的,在网络模型反向传播过程中,需要可微的目标函数。
  (2) 在分类任务中,使用accuracy可以,但是在回归任务中,accuracy便不再可用,只能使用loss
  (3) 损失函数可以有多种优化方法,如牛顿法、极大似然估计等

参考:
https://blog.csdn.net/quiet_girl/article/details/86138489


推荐阅读
  • QBlog开源博客系统:Page_Load生命周期与参数传递优化(第四部分)
    本教程将深入探讨QBlog开源博客系统的Page_Load生命周期,并介绍一种简洁的参数传递重构方法。通过视频演示和详细讲解,帮助开发者更好地理解和应用这些技术。 ... [详细]
  • SQL中UPDATE SET FROM语句的使用方法及应用场景
    本文详细介绍了SQL中UPDATE SET FROM语句的使用方法,通过具体示例展示了如何利用该语句高效地更新多表关联数据。适合数据库管理员和开发人员参考。 ... [详细]
  • python的交互模式怎么输出名文汉字[python常见问题]
    在命令行模式下敲命令python,就看到类似如下的一堆文本输出,然后就进入到Python交互模式,它的提示符是>>>,此时我们可以使用print() ... [详细]
  • 火星商店问题:线段树分治与持久化Trie树的应用
    本题涉及编号为1至n的火星商店,每个商店有一个永久商品价值v。操作包括每天在指定商店增加一个新商品,以及查询某段时间内某些商店中所有商品(含永久商品)与给定密码值的最大异或结果。通过线段树分治和持久化Trie树来高效解决此问题。 ... [详细]
  • Java 中的 BigDecimal pow()方法,示例 ... [详细]
  • 本文总结了汇编语言中第五至第八章的关键知识点,涵盖间接寻址、指令格式、安全编程空间、逻辑运算指令及数据重复定义等内容。通过详细解析这些内容,帮助读者更好地理解和应用汇编语言的高级特性。 ... [详细]
  • 探讨如何高效使用FastJSON进行JSON数据解析,特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • 本文详细介绍了如何使用Maven高效管理多模块项目,涵盖项目结构设计、依赖管理和构建优化等方面。通过具体的实例和配置说明,帮助开发者更好地理解和应用Maven在复杂项目中的优势。 ... [详细]
  • 本文介绍了如何在具备多个IP地址的FTP服务器环境中,通过动态地址端口复用和地址转换技术优化网络配置。重点讨论了2Mb/s DDN专线连接、Cisco 2611路由器及内部网络地址规划。 ... [详细]
  • 深入理解Cookie与Session会话管理
    本文详细介绍了如何通过HTTP响应和请求处理浏览器的Cookie信息,以及如何创建、设置和管理Cookie。同时探讨了会话跟踪技术中的Session机制,解释其原理及应用场景。 ... [详细]
  • 本文介绍了在安装或运行 Python 项目时遇到的 'ModuleNotFoundError: No module named setuptools_rust' 错误,并提供了解决方案。 ... [详细]
  • CentOS7源码编译安装MySQL5.6
    2019独角兽企业重金招聘Python工程师标准一、先在cmake官网下个最新的cmake源码包cmake官网:https:www.cmake.org如此时最新 ... [详细]
  • 构建基于BERT的中文NL2SQL模型:一个简明的基准
    本文探讨了将自然语言转换为SQL语句(NL2SQL)的任务,这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践,该比赛提供了金融和通用领域的表格数据,并标注了对应的自然语言与SQL语句对,旨在训练准确的NL2SQL模型。 ... [详细]
  • 本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用,涵盖基础指令、镜像构建与发布流程,并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]
author-avatar
XL
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有