当前位置: 开发笔记 > 前端 > 正文

FocalLoss理解[转载]

作者：严重孤独症患者_855 | 来源：互联网 | 2023-08-17 17:06

转载地址：https:www.cnblogs.comking-lpsp9497836.html1.总述Focalloss主要是为了解决one-stage目标检测中正负

转载地址&＃xff1a;https://www.cnblogs.com/king-lps/p/9497836.html
1.总述
Focal loss主要是为了解决one-stage目标检测中正负样本比例严重失衡的问题。该损失函数降低了大量简单负样本在训练中所占的权重&＃xff0c;也可理解为一种困难样本挖掘。
2. 损失函数形式
Focal loss是在交叉熵损失函数基础上进行的修改&＃xff0c;首先回顾二分类交叉上损失&＃xff1a;
在这里插入图片描述 $y^{'}$ 是经过激活函数的输出&＃xff0c;所以在0-1之间。可见普通的交叉熵对于正样本而言&＃xff0c;输出概率越大损失越小。对于负样本而言&＃xff0c;输出概率越小则损失越小。此时的损失函数在大量简单样本的迭代过程中比较缓慢且可能无法优化至最优。那么Focal loss是怎么改进的呢&＃xff1f; 在这里插入图片描述
首先在原有的基础上加了一个因子&＃xff0c;其中gamma>0使得减少易分类样本的损失。使得更关注于困难的、错分的样本。

例如gamma为2&＃xff0c;对于正类样本而言&＃xff0c;预测结果为0.95肯定是简单样本&＃xff0c;所以&＃xff08;1-0.95&＃xff09;的gamma次方就会很小&＃xff0c;这时损失函数值就变得更小。而预测概率为0.3的样本其损失相对很大。对于负类样本而言同样&＃xff0c;预测0.1的结果应当远比预测0.7的样本损失值要小得多。对于预测概率为0.5时&＃xff0c;损失只减少了0.25倍&＃xff0c;所以更加关注于这种难以区分的样本。这样减少了简单样本的影响&＃xff0c;大量预测概率很小的样本叠加起来后的效应才可能比较有效。

此外&＃xff0c;加入平衡因子alpha&＃xff0c;用来平衡正负样本本身的比例不均&＃xff1a;
在这里插入图片描述
只添加alpha虽然可以平衡正负样本的重要性&＃xff0c;但是无法解决简单与困难样本的问题。

lambda调节简单样本权重降低的速率&＃xff0c;当lambda为0时即为交叉熵损失函数&＃xff0c;当lambda增加时&＃xff0c;调整因子的影响也在增加。实验发现lambda为2是最优。
3. 总结

作者认为one-stage和two-stage的表现差异主要原因是大量前景背景类别不平衡导致。作者设计了一个简单密集型网络RetinaNet来训练在保证速度的同时达到了精度最优。在双阶段算法中&＃xff0c;在候选框阶段&＃xff0c;通过得分和nms筛选过滤掉了大量的负样本&＃xff0c;然后在分类回归阶段又固定了正负样本比例&＃xff0c;或者通过OHEM在线困难挖掘使得前景和背景相对平衡。而one-stage阶段需要产生约100k的候选位置&＃xff0c;虽然有类似的采样&＃xff0c;但是训练仍然被大量负样本所主导。

推荐阅读

html
使用Numpy实现无外部库依赖的双线性插值图像缩放

本文介绍如何仅使用Numpy库，通过双线性插值方法实现图像的高效缩放，避免了对OpenCV等图像处理库的依赖。文中详细解释了算法原理，并提供了完整的代码示例。 ... [详细]

蜡笔小新 2024-12-28 13:15:40
js
深入理解OAuth认证机制

本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准，旨在为第三方应用提供安全的用户资源访问授权，同时确保用户的账户信息（如用户名和密码）不会暴露给第三方。 ... [详细]

蜡笔小新 2024-12-28 12:07:46
html
QBlog开源博客系统：Page_Load生命周期与参数传递优化（第四部分）

本教程将深入探讨QBlog开源博客系统的Page_Load生命周期，并介绍一种简洁的参数传递重构方法。通过视频演示和详细讲解，帮助开发者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-12-28 10:39:53
html
PyCharm下载与安装指南

本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境（IDE），涵盖Windows、macOS和Linux系统，同时提供详细的安装步骤及配置建议。 ... [详细]

蜡笔小新 2024-12-28 09:42:41
iframe
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
html
程序员思维：深入解析与应用

本文探讨了如何像程序员一样思考，强调了将复杂问题分解为更小模块的重要性，并讨论了如何通过妥善管理和复用已有代码来提高编程效率。 ... [详细]

蜡笔小新 2024-12-28 01:48:10
html
python的交互模式怎么输出名文汉字[python常见问题]

在命令行模式下敲命令python，就看到类似如下的一堆文本输出，然后就进入到Python交互模式，它的提示符是>>>，此时我们可以使用print() ... [详细]

蜡笔小新 2024-12-27 21:32:05
view
火星商店问题：线段树分治与持久化Trie树的应用

本题涉及编号为1至n的火星商店，每个商店有一个永久商品价值v。操作包括每天在指定商店增加一个新商品，以及查询某段时间内某些商店中所有商品（含永久商品）与给定密码值的最大异或结果。通过线段树分治和持久化Trie树来高效解决此问题。 ... [详细]

蜡笔小新 2024-12-27 21:23:11
html
Java 中的 BigDecimal pow()方法，示例

Java 中的 BigDecimal pow()方法，示例 ... [详细]

蜡笔小新 2024-12-27 20:54:03
html
汇编语言高级特性总结

本文总结了汇编语言中第五至第八章的关键知识点，涵盖间接寻址、指令格式、安全编程空间、逻辑运算指令及数据重复定义等内容。通过详细解析这些内容，帮助读者更好地理解和应用汇编语言的高级特性。 ... [详细]

蜡笔小新 2024-12-27 19:52:28
json
FastJSON解析与数据提取技巧

探讨如何高效使用FastJSON进行JSON数据解析，特别是从复杂嵌套结构中提取特定字段值的方法。 ... [详细]

蜡笔小新 2024-12-27 19:49:07
html
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
html
Maven多模块项目管理最佳实践

本文详细介绍了如何使用Maven高效管理多模块项目，涵盖项目结构设计、依赖管理和构建优化等方面。通过具体的实例和配置说明，帮助开发者更好地理解和应用Maven在复杂项目中的优势。 ... [详细]

蜡笔小新 2024-12-27 19:29:15
html
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
html
深入解析JVM垃圾收集器

本文基于《深入理解Java虚拟机：JVM高级特性与最佳实践》第二版，详细探讨了JVM中不同类型的垃圾收集器及其工作原理。通过介绍各种垃圾收集器的特性和应用场景，帮助读者更好地理解和优化JVM内存管理。 ... [详细]

蜡笔小新 2024-12-28 13:35:19

严重孤独症患者_855

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章