当前位置: 开发笔记 > 编程语言 > 正文

自定义损失函数_关于样本于损失函数的权重

作者：mobiledu2502871343 | 来源：互联网 | 2023-09-18 12:15

机器学习损失函数的定义非常重要，损失函数决定了如何从样本数据中进行学习，模型的总体损失函数由对样本的损失求和而来，对于特定问题࿰

机器学习损失函数的定义非常重要&＃xff0c;损失函数决定了如何从样本数据中进行学习&＃xff0c;模型的总体损失函数由对样本的损失求和而来&＃xff0c;对于特定问题&＃xff0c;有三种情况需要特别考虑样本损失的权重。

类别样本不均衡
对样本量比较少的类别&＃xff0c;加大该类样本权重&＃xff0c;使模型不至于忽略了该类别的样本特征。比如对于违约样本占比1:9比例的二分类&＃xff0c;如果不做权重调整&＃xff0c;模型将学习到绝大多数正常样本的特征而忽略了违约样本的特征&＃xff0c;此时模型准确率也能达到90%&＃xff0c;而我们更关注的是违约样本。
错误分类样本权重调整
采用AdaBoost类似的思路&＃xff0c;多个模型组成训练队伍在迭代过程中不断对误判的样本加大权重&＃xff0c;以期在后续的学习中捕获误判样本的特征&＃xff0c;提升模型准确率&＃xff0c;为避免过拟合&＃xff0c;可以采用多个不同模型进行&＃xff0c;学习中不断调整彼此其他模型误判的样本的权重。
Focal Loss
Focal Loss[1]为近来提出的针对hard/easy样本进行权重调整的方法。思路是对容易区分的样本(easy)调低权重&＃xff0c;对难区分&＃xff08;hard&＃xff09;的样本调高权重。比如对于A样本预测概率为(0.9,01)&＃xff0c;说明模型对该样本很自信&＃xff0c;属于easy样本&＃xff0c;对于B样本预测概率为(0.53,0.47)&＃xff0c;说明模型对B这样类似样本的预测缺乏区分度&＃xff0c;可以适当调整该样本的权重。具体的&＃xff0c;Focal Loss的提出者提出了以下形式的损失函数&＃xff1a;

其中

为传统意义上的样本权重&＃xff0c;比如为解决样本不均衡问题&＃xff0c;而

则用于调整hard/easy样本的权重&＃xff0c;但p较高(接近1)时&＃xff0c;说明样本容易区分&＃xff0c;之类样本其权重可以相对调低&＃xff0c;当p较低时&＃xff0c;权重

会相对变大。Focal Loss的提出者实验表明

取2时效果最佳。

Focal函数的图形如下&＃xff0c;

&＃61;0时候退化为一般的交叉熵损失函数。

对于梯度下降的学习方法&＃xff0c;需要其一阶导数。比如在xgboost上可以通过自定义损失函数实现Focal Loss&＃xff0c;因其需要Focal Loss的一阶、二阶导数&＃xff0c;用mathematica给出个符号形式&＃xff1a;

参考文献&＃xff1a;
[1]Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, Piotr Dollár 2017 arXiv:1708.02002

推荐阅读

range
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
io
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
list
LeetCode Python 566 重塑矩阵详解

本题主要考察二维数组的遍历和重塑。通过将二维数组降为一维，再根据新的行数和列数重新构建矩阵。 ... [详细]

蜡笔小新 2024-11-13 16:37:25
instance
Java反射机制详解及应用场景

本文详细介绍了Java反射机制的基本概念、获取Class对象的方法、反射的主要功能及其在实际开发中的应用。通过具体示例，帮助读者更好地理解和使用Java反射。 ... [详细]

蜡笔小新 2024-11-13 16:08:08
case
JUC（三）：深入解析AQS

本文详细介绍了Java并发工具包中的核心类AQS（AbstractQueuedSynchronizer），包括其基本概念、数据结构、源码分析及核心方法的实现。 ... [详细]

蜡笔小新 2024-11-13 15:40:34
io
编写高质量jQuery插件的关键要点

本文详细介绍了在编写jQuery插件时需要注意的关键要点，包括模块化支持、命名规范和性能优化等内容，旨在帮助开发者提高插件的质量和可维护性。 ... [详细]

蜡笔小新 2024-11-13 15:31:57
io
VB.net 进程通信中FindWindow、FindWindowEX、SendMessage函数的理解

目录一、代码背景二、主要工具三、函数解析1、FindWindow：2、FindWindowEx：3、SendMessage： ... [详细]

蜡笔小新 2024-11-13 14:28:28
go
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
instance
Vision Transformer (ViT) 和 DETR 深度解析

本文详细介绍了 Vision Transformer (ViT) 和 DETR 的工作原理，并提供了相关的代码实现和参考资料。通过观看教学视频和阅读博客，对 ViT 的全流程进行了详细的笔记整理，包括代码详解和关键概念的解释。 ... [详细]

蜡笔小新 2024-11-12 20:32:38
case
单片微机原理P3：80C51外部拓展系统

　　外部拓展其实是个相对来说很好玩的章节，可以真正开始用单片机写程序了，比较重要的是外部存储器拓展，81C55拓展，矩阵键盘，动态显示，DAC和ADC。0.IO接口电路概念与存 ... [详细]

蜡笔小新 2024-11-12 19:51:29
io
Spring Boot 使用 JPA 删除数据时 SQL 错误解决方案

本文介绍了在 Spring Boot 中使用 JPA 进行数据删除操作时遇到的 SQL 错误及其解决方法。错误表现为：删除操作失败，原因是无法打开 JPA EntityManager 以进行事务处理。 ... [详细]

蜡笔小新 2024-11-12 18:01:11
io
关于亚像素运动估计的二次模型6之A Quadratic Prediction Based FractionalPixel Motion Estimation Algorithm for H.264

基于二次预测的H.264分数像素运动估计算法在这项研究中，提出了一种基于二次预测的H.264分数像素运动估计（ME）算法。这里ÿ ... [详细]

蜡笔小新 2024-11-12 17:53:48
list
Spring Boot 入门指南：Hello World 示例

本教程详细介绍了如何使用 Spring Boot 创建一个简单的 Hello World 应用程序。适合初学者快速上手。 ... [详细]

蜡笔小新 2024-11-12 15:18:38
io
杜甫《喜晴》的两种英译比较

本文对比了杜甫《喜晴》的两种英文翻译版本：a. Pleased with Sunny Weather 和 b. Rejoicing in Clearing Weather。a 版由 alexcwlin 翻译并经 Adam Lam 编辑，b 版则由哈佛大学的宇文所安教授 (Prof. Stephen Owen) 翻译。 ... [详细]

蜡笔小新 2024-11-12 15:02:28
list
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57

mobiledu2502871343

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章