当前位置: 开发笔记 > 编程语言 > 正文

迁移学习论文（五）：LearningSemanticRepresentationsforUnsupervisedDomainAdaptation论文原理及复现工作

作者：生活趣图分享 | 来源：互联网 | 2023-10-13 10:13

目录前言原理阐述文章介绍模型结构模型总述超参数设置总结前言本文属于我迁移学习专栏里的一篇，该专栏用于记录本人研究生阶段相关迁移学习论文的原理阐述以及复现工作。本专栏

文章介绍

这篇文章于2018年发表在ICML会议&＃xff0c;作者是Shaoan Xie、Zibin Zheng、Liang Chen、Chuan Chen。
这篇文章解决的主要问题是如何利用伪标签来进行域适应。之前的方法都忽略了样本的语义信息&＃xff0c;比如之前的算法可能将目标域的背包映射到源域的小汽车附近。这篇文章最要的贡献就是提出了 moving semantic transfer network 这个网络&＃xff0c;简称mstn&＃xff0c;其主要是通过对齐源域&＃xff08;有标签&＃xff09;和目标域&＃xff08;伪标签&＃xff0c;网络预测一个标签&＃xff09;相同类别的中心&＃xff0c;以学习到样本的语义信息。

模型结构

模型是这样的&＃xff1a;

模型总述

上述模型的G特征提取器和F标签分类器以及D域分类器与DANN中的特征提取器、标签分类器和全局域分类器是一样的&＃xff0c;这里不展开研究了。
这个论文有价值的地方在于使用了伪标签&＃xff0c;提出了semantic transfer loss&＃xff0c;这个论文中的方法其实我也有考虑到过&＃xff0c;我是受了DAAN的启发&＃xff0c;但DAAN应该是受了该文的启发&＃xff0c;因为DAAN是2019年发表的。DAAN中的局部域分类器也是将样本的每个类单独分开计算损失&＃xff0c;但是DAAN计算的是域分类损失&＃xff0c;而MSTN考虑的是MSE&＃xff0c;因为相同类别经过特征提取之后的特征应当是相近的&＃xff0c;这对应域适应中的条件概率损失。
但是MSTN考虑到了两个问题&＃xff0c;1.每次抽取样本可能会使得某些类别没有抽取到样本&＃xff0c;那么就无从计算MSE。2.伪标签可能是不准确的&＃xff0c;这样可能导致相反的效果&＃xff0c;比如使一个书包的特征和一个汽车的特征进行对齐。
MSTN的解决办法非常有意思&＃xff1a;

对每个类维护一个全局特征 $CTk或者CSkC^k_{T}或者C^k_{S}$ &＃xff0c;每次使用 $CTk或者CSkC^k_{T}或者C^k_{S}$ 来计算损失&＃xff0c; $CTk或者CSkC^k_{T}或者C^k_{S}$ 的计算同时考虑当前的 $CTk或者CSkC^k_{T}或者C^k_{S}$ 和本次根据样本生成的平均特征。所以就算本次抽取样本中没有某一类的样本&＃xff0c;也可以根据该类上一次的 $CTk或者CSkC^k_{T}或者C^k_{S}$ 来计算&＃xff0c;同时假如有错误的伪标签也因为占比不大所以影响不大。
其实MSTN这种解决办法也是尽可能的削弱错误影响&＃xff0c;并没有根本上解决这些问题。

超参数设置

学习率采用衰减&＃xff0c;

p是迭代次数占总的比例&＃xff0c;学习率每次迭代更新一次&＃xff0c;

def train(epoch, model, sourceDataLoader, targetDataLoader,DEVICE,args):learningRate&＃61;args.lr/math.pow((1&＃43;10*(epoch-1)/args.epoch),0.75)

损失函数
三项分别是标签分类损失&＃xff0c;域分类损失&＃xff0c;semantic transfer loss&＃xff0c;其中 $γ &＃61; λ$ &＃xff0c;λ遵循下面的公式&＃xff1a;

里面的上图的γ可不是损失函数中的γ&＃xff0c;上图的p设置为当前batchid占总的比例&＃xff0c;如下代码所示&＃xff1a;

lenSourceDataLoader &＃61; len(sourceDataLoader)for batch_idx, (sourceData, sourceLabel) in tqdm.tqdm(enumerate(sourceDataLoader),total&＃61;lenSourceDataLoader,desc&＃61;&＃39;Train epoch {}&＃39;.format(epoch),ncols&＃61;80,leave&＃61;False):p &＃61; float(batch_idx &＃43; 1 &＃43; epoch * lenSourceDataLoader) / args.epoch / lenSourceDataLoaderalpha &＃61; 2. / (1. &＃43; np.exp(-10 * p)) - 1

CNN 采用的是AlexNet作为基本结构&＃xff0c;fc7后面接了一个bottleneck layer&＃xff08;瓶颈层&＃xff0c;主要作用是降维&＃xff09;。
鉴别器&＃xff0c;我们采用的是RevGard相同的结构&＃xff1a;x-》1024-》1024-》2
超参数的设置&＃xff1a;θ &＃61; 0.7。

总结

该文总体来说提供了一种思路&＃xff0c;但是我觉得伪标签的问题其实并没有办法真正解决&＃xff0c;会限制该类模型的上限并不会很高。

推荐阅读

regex
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
schema
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
ip
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
ip
UNP 第9章：主机名与地址转换

本章探讨了用于在主机名和数值地址之间进行转换的函数，如gethostbyname和gethostbyaddr。此外，还介绍了getservbyname和getservbyport函数，用于在服务器名和端口号之间进行转换。 ... [详细]

蜡笔小新 2024-12-27 11:26:39
instance
解析Java中Text.splitText()方法及其应用场景

本文详细介绍了Java中org.w3c.dom.Text类的splitText()方法，通过多个代码示例展示了其实际应用。该方法用于将文本节点在指定位置拆分为两个节点，并保持在文档树中。 ... [详细]

蜡笔小新 2024-12-26 18:31:42
stream
解析JSON格式文本并处理数据

本文介绍如何使用阿里云的fastjson库解析包含时间戳、IP地址和参数等信息的JSON格式文本，并进行数据处理和保存。 ... [详细]

蜡笔小新 2024-12-26 16:06:09
stream
HDFS与Hive中的数据存储和管理机制

本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射，详细解释了两者的创建、加载及删除操作，并提供了查看表详细信息的方法。通过对比这两种表类型，帮助读者理解如何更好地管理和保护数据。 ... [详细]

蜡笔小新 2024-12-27 20:21:48
go
深入解析：手把手教你构建决策树算法

本文详细介绍了机器学习中广泛应用的决策树算法，通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字，建议阅读时间5分钟。 ... [详细]

蜡笔小新 2024-12-27 13:44:59
go
Apache Jena 中 Txn.executeWrite 方法详解与代码示例

本文详细介绍了 Apache Jena 库中的 Txn.executeWrite 方法，通过多个实际代码示例展示了其在不同场景下的应用，帮助开发者更好地理解和使用该方法。 ... [详细]

蜡笔小新 2024-12-26 17:55:52
go
Weight the Tree（树形dp）

题目Link题目学习link1题目学习link2题目学习link3%%%受益匪浅！－－－－－&# ... [详细]

蜡笔小新 2024-12-26 15:55:56
schema
深入解析 org.apache.xmlbeans.SchemaType.getBaseEnumType() 方法及其应用

本文详细介绍了 Java 中 org.apache.xmlbeans.SchemaType 类的 getBaseEnumType() 方法，提供了多个代码示例，并解释了其在不同场景下的使用方法。 ... [详细]

蜡笔小新 2024-12-26 11:46:55
ip
ECharts线性渐变色应用实例

本文详细介绍了如何在ECharts中使用线性渐变色，通过echarts.graphic.LinearGradient方法实现。文章不仅提供了完整的代码示例，还解释了各个参数的具体含义及其应用场景。 ... [详细]

蜡笔小新 2024-12-26 08:13:53
usb
基于KVM的SRIOV直通配置及性能测试

SRIOV介绍、VF直通配置，以及包转发率性能测试小慢哥的原创文章，欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]

蜡笔小新 2024-12-25 19:26:39
usb
深入探讨CPU虚拟化与KVM内存管理

本文详细介绍了现代服务器架构中的CPU虚拟化技术，包括SMP、NUMA和MPP三种多处理器结构，并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景，帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]

蜡笔小新 2024-12-25 19:15:51
schema
深入理解领域驱动设计及其实践

本文探讨了领域驱动设计（DDD）的核心概念、应用场景及其实现方式，详细介绍了其在企业级软件开发中的优势和挑战。通过对比事务脚本与领域模型，展示了DDD如何提升系统的可维护性和扩展性。 ... [详细]

蜡笔小新 2024-12-25 18:45:55

生活趣图分享

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章