当前位置: 开发笔记 > 编程语言 > 正文

迁移学习论文（五）：LearningSemanticRepresentationsforUnsupervisedDomainAdaptation论文原理及复现工作

作者：生活趣图分享 | 来源：互联网 | 2023-10-13 10:13

目录前言原理阐述文章介绍模型结构模型总述超参数设置总结前言本文属于我迁移学习专栏里的一篇，该专栏用于记录本人研究生阶段相关迁移学习论文的原理阐述以及复现工作。本专栏

文章介绍

这篇文章于2018年发表在ICML会议&＃xff0c;作者是Shaoan Xie、Zibin Zheng、Liang Chen、Chuan Chen。
这篇文章解决的主要问题是如何利用伪标签来进行域适应。之前的方法都忽略了样本的语义信息&＃xff0c;比如之前的算法可能将目标域的背包映射到源域的小汽车附近。这篇文章最要的贡献就是提出了 moving semantic transfer network 这个网络&＃xff0c;简称mstn&＃xff0c;其主要是通过对齐源域&＃xff08;有标签&＃xff09;和目标域&＃xff08;伪标签&＃xff0c;网络预测一个标签&＃xff09;相同类别的中心&＃xff0c;以学习到样本的语义信息。

模型结构

模型是这样的&＃xff1a;

模型总述

上述模型的G特征提取器和F标签分类器以及D域分类器与DANN中的特征提取器、标签分类器和全局域分类器是一样的&＃xff0c;这里不展开研究了。
这个论文有价值的地方在于使用了伪标签&＃xff0c;提出了semantic transfer loss&＃xff0c;这个论文中的方法其实我也有考虑到过&＃xff0c;我是受了DAAN的启发&＃xff0c;但DAAN应该是受了该文的启发&＃xff0c;因为DAAN是2019年发表的。DAAN中的局部域分类器也是将样本的每个类单独分开计算损失&＃xff0c;但是DAAN计算的是域分类损失&＃xff0c;而MSTN考虑的是MSE&＃xff0c;因为相同类别经过特征提取之后的特征应当是相近的&＃xff0c;这对应域适应中的条件概率损失。
但是MSTN考虑到了两个问题&＃xff0c;1.每次抽取样本可能会使得某些类别没有抽取到样本&＃xff0c;那么就无从计算MSE。2.伪标签可能是不准确的&＃xff0c;这样可能导致相反的效果&＃xff0c;比如使一个书包的特征和一个汽车的特征进行对齐。
MSTN的解决办法非常有意思&＃xff1a;

对每个类维护一个全局特征 $CTk或者CSkC^k_{T}或者C^k_{S}$ &＃xff0c;每次使用 $CTk或者CSkC^k_{T}或者C^k_{S}$ 来计算损失&＃xff0c; $CTk或者CSkC^k_{T}或者C^k_{S}$ 的计算同时考虑当前的 $CTk或者CSkC^k_{T}或者C^k_{S}$ 和本次根据样本生成的平均特征。所以就算本次抽取样本中没有某一类的样本&＃xff0c;也可以根据该类上一次的 $CTk或者CSkC^k_{T}或者C^k_{S}$ 来计算&＃xff0c;同时假如有错误的伪标签也因为占比不大所以影响不大。
其实MSTN这种解决办法也是尽可能的削弱错误影响&＃xff0c;并没有根本上解决这些问题。

超参数设置

学习率采用衰减&＃xff0c;

p是迭代次数占总的比例&＃xff0c;学习率每次迭代更新一次&＃xff0c;

def train(epoch, model, sourceDataLoader, targetDataLoader,DEVICE,args):learningRate&＃61;args.lr/math.pow((1&＃43;10*(epoch-1)/args.epoch),0.75)

损失函数
三项分别是标签分类损失&＃xff0c;域分类损失&＃xff0c;semantic transfer loss&＃xff0c;其中 $γ &＃61; λ$ &＃xff0c;λ遵循下面的公式&＃xff1a;

里面的上图的γ可不是损失函数中的γ&＃xff0c;上图的p设置为当前batchid占总的比例&＃xff0c;如下代码所示&＃xff1a;

lenSourceDataLoader &＃61; len(sourceDataLoader)for batch_idx, (sourceData, sourceLabel) in tqdm.tqdm(enumerate(sourceDataLoader),total&＃61;lenSourceDataLoader,desc&＃61;&＃39;Train epoch {}&＃39;.format(epoch),ncols&＃61;80,leave&＃61;False):p &＃61; float(batch_idx &＃43; 1 &＃43; epoch * lenSourceDataLoader) / args.epoch / lenSourceDataLoaderalpha &＃61; 2. / (1. &＃43; np.exp(-10 * p)) - 1

CNN 采用的是AlexNet作为基本结构&＃xff0c;fc7后面接了一个bottleneck layer&＃xff08;瓶颈层&＃xff0c;主要作用是降维&＃xff09;。
鉴别器&＃xff0c;我们采用的是RevGard相同的结构&＃xff1a;x-》1024-》1024-》2
超参数的设置&＃xff1a;θ &＃61; 0.7。

总结

该文总体来说提供了一种思路&＃xff0c;但是我觉得伪标签的问题其实并没有办法真正解决&＃xff0c;会限制该类模型的上限并不会很高。

推荐阅读

format
使用Matlab创建动态GIF动画

动态GIF图可以有效增强数据表达的直观性和吸引力。本文将详细介绍如何利用Matlab软件生成动态GIF图，涵盖基本代码实现与高级应用技巧。 ... [详细]

蜡笔小新 2024-11-22 16:52:32
version
Ubuntu 14.04 环境下搭建 Caffe（仅限 CPU）

本文详细介绍了如何在 Ubuntu 14.04 系统上搭建仅使用 CPU 的 Caffe 深度学习框架，包括环境准备、依赖安装及编译过程。 ... [详细]

蜡笔小新 2024-11-22 16:43:30
string
处理Android EditText中数字输入与parseInt方法

本文探讨了如何在Android应用中从EditText组件安全地获取并解析用户输入的数字，特别是用于设置端口号的情况。通过示例代码和异常处理策略，展示了有效的方法来避免因非法输入导致的应用崩溃。 ... [详细]

蜡笔小新 2024-11-21 20:37:54
version
Maven + Spring + MyBatis + MySQL 环境搭建与实例解析

本文详细介绍如何使用MySQL数据库进行环境搭建，包括创建数据库表并插入示例数据。随后，逐步指导如何配置Maven项目，整合Spring框架与MyBatis，实现高效的数据访问。 ... [详细]

蜡笔小新 2024-11-21 18:39:23
string
UVALive 8201 - BBP 公式计算圆周率

在1995年，Simon Plouffe 发现了一种特殊的求和方法来表示某些常数。两年后，Bailey 和 Borwein 在他们的论文中发表了这一发现，这种方法被命名为 Bailey-Borwein-Plouffe (BBP) 公式。该问题要求计算圆周率 π 的第 n 个十六进制数字。 ... [详细]

蜡笔小新 2024-11-21 18:32:57
list
如何使用 org.apache.tinkerpop.gremlin.structure.VertexProperty 的 key 方法

本文详细介绍了 `org.apache.tinkerpop.gremlin.structure.VertexProperty` 类中的 `key()` 方法，并提供了多个实际应用的代码示例。通过这些示例，读者可以更好地理解该方法在图数据库操作中的具体用途。 ... [详细]

蜡笔小新 2024-11-21 17:38:10
string
web: _show -> _info 造轮子编程

问题场景用Java进行web开发过程当中，当遇到很多很多个字段的实体时，最苦恼的莫过于编辑字段的查看和修改界面，发现2个页面存在很多重复信息，能不能写一遍？有没有轮子用都不如自己造。解决方式笔者根据自 ... [详细]

蜡笔小新 2024-11-21 10:21:24
select
Web动态服务器Python基本实现

Web动态服务器Python基本实现 ... [详细]

蜡笔小新 2024-11-21 08:01:30
list
理解浏览器历史记录（2）hashchange、pushState

阅读目录1.hashchange2.pushState本文也是一篇基础文章。继上文之后，本打算去研究pushState，偶然在一些信息中发现了锚点变 ... [详细]

蜡笔小新 2024-11-20 20:05:37
runtime
解决 Android Studio 3.1 升级后的编译问题

在将 Android Studio 从 3.0 升级到 3.1 版本后，遇到项目无法正常编译的问题，具体错误信息为：org.gradle.api.tasks.TaskExecutionException: Execution failed for task ':app:processDemoProductDebugResources'。 ... [详细]

蜡笔小新 2024-11-20 10:56:42
version
深入解析 Java 中 org.w3c.dom.Node.isEqualNode() 方法及其应用实例

本文详细介绍了 Java 中 org.w3c.dom.Node 类的 isEqualNode() 方法的功能、参数及返回值，并通过多个实际代码示例来展示其具体应用。此方法用于检测两个节点是否相等，而不仅仅是判断它们是否为同一个对象。 ... [详细]

蜡笔小新 2024-11-19 18:11:10
nodejs
利用Node.js实现PSD文件的高效切图

本文介绍了如何通过Node.js及其psd2json模块，快速实现PSD文件的自动化切图过程，以适应项目中频繁的界面更新需求。此方法不仅提高了工作效率，还简化了从设计稿到实际应用的转换流程。 ... [详细]

蜡笔小新 2024-11-22 13:21:24
string
递归实现表达式求和

本文通过C++语言实现了一个递归算法，用于解析并计算数学表达式的值。该算法能够处理加法、减法、乘法和除法操作。 ... [详细]

蜡笔小新 2024-11-21 15:38:13
list
linux网络子系统分析（二）—— 协议栈分层框架的建立

目录一、综述二、INET的初始化2.1INET接口注册2.2抽象实体的建立2.3代码细节分析2.3.1socket参数三、其他协议3.1PF_PACKET3.2P ... [详细]

蜡笔小新 2024-11-20 15:21:14
nodejs
实践指南：使用Express、Create React App与MongoDB搭建React开发环境

本文详细介绍了如何利用Express、Create React App和MongoDB构建一个高效的React应用开发环境，旨在为开发者提供一套完整的解决方案，包括环境搭建、数据模拟及前后端交互。 ... [详细]

蜡笔小新 2024-11-20 10:05:15

生活趣图分享

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章