深度学习（17）——度量学习

作者：Cher麻花 | 来源：互联网 | 2023-07-21 19:14

深度学习（17）——度量学习文章目录深度学习（17）——度量学习一、What?二、paired-basedloss1.Con

深度学习&＃xff08;17&＃xff09;—— 度量学习

文章目录

深度学习&＃xff08;17&＃xff09;—— 度量学习
- 一、What?
- 二、paired-based loss
- - 1. Contrastive loss
  - 2. Triplet loss
  - 3. Triplet center loss
  - 4.N-pair loss
  - 5. Quadruplet loss
  - 6. Lifted Structure Loss

昨天讨论的时候一个大佬提到了Metric Learning&＃xff0c;听他讲了一下大致思路&＃xff0c;觉得有点意思&＃xff0c;所以下来了解了一下&＃xff0c;简单记录

一、What?

度量学习是一种空间映射的方法&＃xff0c;它可以学习到一种特征空间&＃xff08;Embedding&＃xff09;&＃xff0c;会将所有的数据转化为一个共同空间中的特征向量&＃xff0c;在这些向量中&＃xff0c;越相似样本的特征向量距离越近&＃xff0c;不相似的样本的特征向量之间距离大&＃xff0c;将数据进行区分。

二、paired-based loss

1. Contrastive loss

Contrastive loss能够让正样本(越相似的样本)对尽可能的近&＃xff0c;负样本对尽可能的远&＃xff0c;这样可以增大类间差异&＃xff0c;减小类内差异。但是其需要指定一个固定的margin&＃xff0c;因为margin是固定的&＃xff0c;所以这里就隐含了一个很强的假设&＃xff0c;即每个类目的样本分布都是相同的&＃xff0c;不过一般情况下这个强假设未必成立。

例如&＃xff0c;有一个数据集有三种动物&＃xff0c;分别是狗、狼、猫&＃xff0c;直观上狗和狼比较像&＃xff0c;狗和猫的差异比较大&＃xff0c;所以狗狼之间的margin应该小于狗猫之间的margin&＃xff0c;但是Contrastive loss使用的是固定的margin&＃xff0c;如果margin设定的比较大&＃xff0c;模型可能无法很好的区分狗和狼&＃xff0c;而margin设定的比较小的话&＃xff0c;可能又无法很好的区分狗和猫。

2. Triplet loss

Triplet Loss的思想是让负样本对之间的距离大于正样本对之间的距离&＃xff0c;在训练过的过程中同时选取一对正样本对和负样本对&＃xff0c;且正负样本对中有一个样本是相同的。仍旧以前面的狗、狼、猫数据为例&＃xff0c;首先随机选取一个样本&＃xff0c;此样本称之为anchor 样本&＃xff0c;假设此样本类别为狗&＃xff0c;然后选取一个与anchor样本同类别的样本&＃xff08;另一个狗狗&＃xff09;&＃xff0c;称之为positive&＃xff0c;并让其与anchor样本组成一个正样本对&＃xff08;anchor-positive&＃xff09;&＃xff1b;再选取一个与anchor不同类别的样本&＃xff08;猫&＃xff09;&＃xff0c;称之为negative&＃xff0c;让其与anchor样本组成一个负样本对&＃xff08;anchor-negative&＃xff09;。
在这里插入图片描述
当负样本对之间的距离比正样本对之间的距离大m的时候&＃xff0c;loss为0 &＃xff0c;认为当前模型已经学的不错了&＃xff0c;所以不对模型进行更新。

3. Triplet center loss

Triplet Center loss的思想非常简单&＃xff0c;原来的Triplet是计算anchor到正负样本之间的距离&＃xff0c;现在Triplet Center是计算anchor到正负样本所在类别的中心的距离。类别中心就是该类别所有样本embedding向量的中心
在这里插入图片描述

4.N-pair loss

N-pair loss选取了多个负样本对&＃xff0c;即一对正样本对&＃xff0c;选取其他所有不同类别的样本作为负样本与其组合得到负样本对。如果数据集中有N个类别&＃xff0c;则每个正样本对Yii 都对应了N-1个负样本对。
在这里插入图片描述

5. Quadruplet loss

Quadruplet loss由两部分组成&＃xff1a;

一部分就是正常的triplet loss&＃xff0c;这部分loss能够让模型区分出正样本对和负样本对之间的相对距离。
另一部分是正样本对和其他任意负样本对之前的相对距离。这一部分约束可以理解成最小的类间距离都要大于类内距离&＃xff0c;不管这些样本对是否有同样的anchor

6. Lifted Structure Loss

Lifted Structure loss的思想是对于一对正样本对而言&＃xff0c;不去区分这个样本对中谁是anchor&＃xff0c;谁是positive&＃xff0c;而是让这个正样本对中的每个样本与其他所有负样本的距离都大于给定的阈值。此方法能够充分的利用mini-batch中的所有样本&＃xff0c;挖掘出所有的样本对。

推荐阅读

io
c语言拓展数学函数库,c语言数学库

C语言中全部可用的数学函数有哪些？2．longlabs(longn);求长整型数的绝对值。3．doublefabs(doublex);求实数的绝对值。4．doublefloor(d ... [详细]

蜡笔小新 2024-11-13 14:46:34
io
图像相似度对比的多种方法

本文介绍了几种常用的图像相似度对比方法，包括直方图方法、图像模板匹配、PSNR峰值信噪比、SSIM结构相似性和感知哈希算法。每种方法都有其优缺点，适用于不同的应用场景。 ... [详细]

蜡笔小新 2024-11-13 11:04:56
go
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
io
洛谷 P1531 我讨厌它 —— 线段树实现

本文介绍如何使用线段树解决洛谷 P1531 我讨厌它问题，重点在于单点更新和区间查询最大值。 ... [详细]

蜡笔小新 2024-11-12 21:27:38
数组
PHP 对象生命周期与内存管理

本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用，包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]

蜡笔小新 2024-11-12 13:35:26
io
Delphi 7下最小化到系统托盘（主要是WM_TRAYMSG和WM_SYSCOMMAND消息）

在Delphi7下要制作系统托盘，只能制作一个比较简单的系统托盘，因为ShellAPI文件定义的TNotifyIconData结构体是比较早的版本。定义如下：1234 ... [详细]

蜡笔小新 2024-11-12 12:32:15
io
[BZOJ2654] Tree 问题：二分查找与 Kruskal 算法结合的优化解决方案

题目《BZOJ2654: Tree》的时间限制为30秒，内存限制为512MB。该问题通过结合二分查找和Kruskal算法，提供了一种高效的优化解决方案。具体而言，利用二分查找缩小解的范围，再通过Kruskal算法构建最小生成树，从而在复杂度上实现了显著的优化。此方法不仅提高了算法的效率，还确保了在大规模数据集上的稳定性能。 ... [详细]

蜡笔小新 2024-11-11 18:19:28
io
深入解析C语言中结构体的内存对齐机制及其优化方法

为了提高CPU访问效率，C语言中的结构体成员在内存中遵循特定的对齐规则。本文详细解析了这些对齐机制，并探讨了如何通过合理的布局和编译器选项来优化结构体的内存使用，从而提升程序性能。 ... [详细]

蜡笔小新 2024-11-11 11:53:59
io
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
io
进程间通信：描述符传递技术深入解析

在深入探讨进程间通信技术时，本文重点解析了描述符传递的方法。通过详细分析发送和接收描述符的过程，文章首先介绍了发送描述符的具体步骤，并提供了相关函数原型。此外，还讨论了如何高效地在不同进程之间传输文件描述符，以实现资源的共享和同步。这一技术在多进程应用中具有重要意义，能够显著提升系统的性能和可靠性。 ... [详细]

蜡笔小新 2024-11-10 09:50:09
io
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
io
OSChina 周末闲谈 —— 程序员的浪漫情话

在OSChina的周末闲谈栏目中，探讨了程序员特有的浪漫情话。本文不仅分享了一些程序员如何用代码表达爱意的有趣例子，还推荐了一首适合程序员聆听的歌曲——李克勤的《啜泣》。对于喜欢在编程之余享受音乐的朋友们，不妨点击链接试听一下。 ... [详细]

蜡笔小新 2024-11-09 15:46:47
io
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
io
【Python编程基础】深入理解Python中的循环结构

在《Python编程基础》课程中，我们将深入探讨Python中的循环结构。通过详细解析for循环和while循环的语法与应用场景，帮助初学者掌握循环控制语句的核心概念和实际应用技巧。此外，还将介绍如何利用循环结构解决复杂问题，提高编程效率和代码可读性。 ... [详细]

蜡笔小新 2024-11-04 15:46:58
io
全栈工程师在当今技术领域的角色与价值探析

当前，众多初创企业对全栈工程师的需求日益增长，但市场中却存在大量所谓的“伪全栈工程师”，尤其是那些仅掌握了Node.js技能的前端开发人员。本文旨在深入探讨全栈工程师在现代技术生态中的真实角色与价值，澄清对这一角色的误解，并强调真正的全栈工程师应具备全面的技术栈和综合解决问题的能力。 ... [详细]

蜡笔小新 2024-10-31 10:28:12

Cher麻花

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章