联合概率分布_迁移学习领域自适应：具有类间差异的联合概率最大平均差异

作者：周俪劳伦瑶的瑶 | 来源：互联网 | 2023-09-23 14:35

©PaperWeekly原创作者｜张玮玮学校｜东北大学硕士生研究方向｜情感识别论文标题：DiscriminativeJoin

©PaperWeekly 原创 · 作者&＃xff5c;张玮玮

学校&＃xff5c;东北大学硕士生

研究方向&＃xff5c;情感识别

论文标题&＃xff1a;Discriminative Joint Probability Maximum Mean Discrepancy (DJP-MMD) for Domain Adaptation论文链接&＃xff1a;https://arxiv.org/abs/1912.00320代码链接&＃xff1a;https://github.com/chamwen/JPDA

领域适应(DA)&＃xff0c;或迁移学习&＃xff0c;通过将知识从标记的源域转移到新的未标记或部分标记的目标域&＃xff0c;广泛应用于图像分类、情绪识别、脑机接口等。传统的 DA 方法遵循这个假设&＃xff0c;即主要使用一些度量方法来分别度量边际概率或条件概率分布。然而&＃xff0c;联合概率分布可以更好地测量两个域的分布差异。

为了方便利用 DA 方法&＃xff0c;在特征转换时需要考虑两个方面&＃xff1a;1)可迁移性&＃xff0c;它最小化了同一类在不同域之间的差异&＃xff1b;2)区分性&＃xff0c;它最大限度地扩大了不同域的不同类之间的差异&＃xff0c;从而使不同的类更容易区分。

传统的 DA 方法只考虑可迁移性&＃xff0c;而忽略了类内可区分性。作者直接考虑了源域和目标域具有不同的联合概率分布的情况&＃xff0c; 提出了具有类间差异的联合概率最大平均差异。

通过直接考虑联合概率分布的差异&＃xff0c;作者提出了一种用于分布适应的具有类间差异的联合概率 MMD ( discriminative joint probability MMD, DJP-MMD)。

它同时最小化了同一类不同域之间的联合概率分布差异以获得可迁移性&＃xff0c;最大化了不同域之间的联合概率分布差异以获得可识别性。还可以很容易地将 DJP-MMD 用于考虑不同域之间的非线性转移。

DJP-MMD知识基础

1.1 传统MMD方法

在传统的 DA 方法中&＃xff0c;经常使用 MMD 来度量源域和目标域之间的分布差异。一个分布差异完全是由它的联合概率来描述的&＃xff0c;它可以被或等价地计算出来。

上式需要两步才能被近似计算出来。条件分布差异是&＃xff1a;边缘分布差异是&＃xff1a;

表示子空间样本的期望。引入一个非线性映射 &＃xff0c;MMD 距离可以写成如下式&＃xff1a;

当是 TCA 方法&＃xff0c;是 JDA 方法&＃xff0c;是 BDA。因此&＃xff0c;这些传统的 DA 方法是基于边际和条件的权值完成 MMDs 近似联合概率分布。

论文方法2.1 DJP-MMD

上图将传统的联合 MMD 提出的 DJP-MMD 进行了比较&＃xff0c;从图中可以看出&＃xff0c;DJP-MMD 使来自不同域的同一个类更加一致&＃xff0c;使不同的类更加分离&＃xff0c;便于分类。

联合概率差异可以定义为&＃xff1a;

&＃xff0c;表示两个领域之间的类内差异与类间差异。因此具有差异的联合概率差异可以定义为&＃xff1a;&＃xff0c;其中可以表示为&＃xff1a;

可以表示为&＃xff1a;

同样表示为&＃xff1a;

作者将其嵌入到一个非监督联合概率 DA (JPDA) 框架中&＃xff0c;该框架具有一个正则化项和一个主成分保留约束。整体优化函数需要将式中的最小化&＃xff0c;即&＃xff0c;求解最优线性映射&＃xff1a;

其中&＃xff0c;&＃xff0c;&＃xff0c;是中心矩阵。

2.2 JPDA优化让 &＃xff0c;可以得到拉格朗日函数 &＃xff1a;

通过设置 &＃xff0c;成为一个广义的特征分解问题 &＃xff1a;

2.3 JPDA伪代码

结果

为了评估本文方法的性能&＃xff0c;作者在 Offifice&＃43;Caltech 、COIL 、Multi-PIE 、USPS 、MNIST 数据集进行了实验&＃xff0c;将所提出的 JPDA 与三种无监督 DA 方法(TCA、JDA和BDA)进行比较。实验结果与 t-SNE 数据分布结果如下图。

JPDA 在大部分任务中都优于 3 个基线实验&＃xff0c;平均性能也最好&＃xff0c;这说明 JPDA 在跨域视觉适应中可以获得更强的可迁移性和更强的鉴别特征映射。

t-SNE 数据分布图中&＃xff0c;Raw 表示原始数据分布。对于原始分布&＃xff0c;来自源域和目标域的类 1 和类 3(也有一些来自类 2)的样本混合在一起。在 DA 之后&＃xff0c;JPDA 将源域和目标域的数据分布放在一起&＃xff0c;并将来自不同类的样本很好地分隔开。

从柱形图上看&＃xff0c;JP-MMD 优于联合 MMD&＃xff0c;而 DJP-MMD 进一步考虑了可分辨性&＃xff0c;获得了最好的分类性能。

结论

本文提出了一种简单而有效的 DJP-MMD 方法。通过最小化源域和目标域(即&＃xff0c;提高域可转移性)&＃xff0c;最大限度地提高不同类的联合概率 MMD(即&＃xff0c;增加类的辨别力)。

与传统的基于 MMD 的方法相比&＃xff0c;JPDA 更简单、更有效地测量了不同领域之间的差异。在 6 个图像分类数据集上的实验验证了 JPDA 的优越性。

现在&＃xff0c;在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域&＃xff0c;欢迎在公众号后台点击「交流群」&＃xff0c;小助手将把你带入 PaperWeekly 的交流群里。

推荐阅读

人工智能
python解决CSF布料模拟滤波的批处理问题（解决获取多个点云数据las数据）

解决问题：1、批量读取点云las数据2、点云数据读与写出3、csf滤波分类参考：https:github.comsuyunzzzCSF论文题目ÿ ... [详细]

蜡笔小新 2024-11-12 11:32:15
ip
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
version
ElasticStack 日志监控：Logstash 编码插件详解与生产环境应用实例分析

在ElasticStack日志监控系统中，Logstash编码插件自5.0版本起进行了重大改进。插件被独立拆分为gem包，每个插件可以单独进行更新和维护，无需依赖Logstash的整体升级。这不仅提高了系统的灵活性和可维护性，还简化了插件的管理和部署过程。本文将详细介绍这些编码插件的功能、配置方法，并通过实际生产环境中的应用案例，展示其在日志处理和监控中的高效性和可靠性。 ... [详细]

蜡笔小新 2024-11-09 19:27:28
match
SSL 错误：目标主机名与备用证书主题名称不匹配

在使用 `git clone` 命令时，常见的 SSL 错误表现为：无法访问指定的 HTTPS 地址（如 `https://ip_or_domain/xxxx.git`），原因是目标主机名与备用证书主题名称不匹配。这通常是因为服务器的 SSL 证书配置不正确或客户端的证书验证设置有问题。建议检查服务器的 SSL 证书配置，确保其包含正确的主机名，并确认客户端的证书信任库已更新。此外，可以通过临时禁用 SSL 验证来排查问题，但请注意这会降低安全性。 ... [详细]

蜡笔小新 2024-11-07 22:49:18
require
技术日志：使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告

技术日志：使用 Ruby 爬虫抓取拉勾网职位数据并生成词云分析报告 ... [详细]

蜡笔小新 2024-11-07 14:33:19
require
掌握PHP编程必备知识与技巧——全面教程

掌握PHP编程必备知识与技巧——全面教程在当今的PHP开发中，了解并运用最新的技术和最佳实践至关重要。本教程将详细介绍PHP编程的核心知识与实用技巧。首先，确保你正在使用PHP 5.3或更高版本，最好是最新版本，以充分利用其性能优化和新特性。此外，我们还将探讨代码结构、安全性和性能优化等方面的内容，帮助你成为一名更高效的PHP开发者。 ... [详细]

蜡笔小新 2024-11-03 16:38:49
ip
深入浅出解读奇异值分解，助你轻松掌握核心概念

深入浅出解读奇异值分解，助你轻松掌握核心概念 ... [详细]

蜡笔小新 2024-11-03 15:12:45
ip
中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程

中国学者实现 CNN 全程可视化，详尽展示每次卷积、ReLU 和池化过程 ... [详细]

蜡笔小新 2024-11-03 13:52:28
process
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
char
剑指Offer 44. 反转字符串中的单词

题目描述：牛客网新员工Fish每天早上都会拿着一本英文杂志，在本子上写下一些句子。他的同事Cat对这些句子非常感兴趣，但发现这些句子的单词顺序被反转了。例如，“student. a am I”实际上是“I am a student.”。Cat请求你帮助他恢复这些句子的正常顺序。 ... [详细]

蜡笔小新 2024-11-13 19:40:26
ip
深入理解 JavaScript 函数式编程技巧与应用（下篇）

本文将继续探讨 JavaScript 函数式编程的高级技巧及其实际应用。通过一个具体的寻路算法示例，我们将深入分析如何利用函数式编程的思想解决复杂问题。示例中，节点之间的连线代表路径，连线上的数字表示两点间的距离。我们将详细讲解如何通过递归和高阶函数等技术实现高效的寻路算法。 ... [详细]

蜡笔小新 2024-11-08 19:44:31
version
探索高效算法：寻找所有和为N的组合方案

本文探讨了一种高效的算法，用于生成所有数字（0-9）的六位组合，允许重复使用数字，并确保这些组合的和等于给定的整数N。该算法通过优化搜索策略，显著提高了计算效率，适用于大规模数据处理和组合优化问题。 ... [详细]

蜡笔小新 2024-11-08 09:58:47
process
Python全局解释器锁（GIL）机制详解

在Python中，线程是操作系统级别的原生线程。为了确保多线程环境下的内存安全，Python虚拟机引入了全局解释器锁（Global Interpreter Lock，简称GIL）。GIL是一种互斥锁，用于保护对解释器状态的访问，防止多个线程同时执行字节码。尽管GIL有助于简化内存管理，但它也限制了多核处理器上多线程程序的并行性能。本文将深入探讨GIL的工作原理及其对Python多线程编程的影响。 ... [详细]

蜡笔小新 2024-11-08 08:19:19
process
利用Python实现高效语音识别技术

本文探讨了利用Python实现高效语音识别技术的方法。通过使用先进的语音处理库和算法，本文详细介绍了如何构建一个准确且高效的语音识别系统。提供的代码示例和实验结果展示了该方法在实际应用中的优越性能。相关文件可从以下链接下载：链接：https://pan.baidu.com/s/1RWNVHuXMQleOrEi5vig_bQ，提取码：p57s。 ... [详细]

蜡笔小新 2024-11-07 13:05:53
ip
Python与R语言的功能对比及应用场景分析

Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性，但Python作为一种通用编程语言，适用于更广泛的领域，包括Web开发、自动化脚本和机器学习等。对于初学者而言，Python的学习曲线更为平缓，上手更加容易。此外，Python拥有庞大的社区支持和丰富的第三方库，使其在实际应用中更具灵活性和扩展性。 ... [详细]

蜡笔小新 2024-11-01 18:37:10

周俪劳伦瑶的瑶

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章