当前位置: 开发笔记 > 编程语言 > 正文

机器学习14迁移学习transferlearning

作者：JRamboKing | 来源：互联网 | 2023-08-27 13:51

1总览迁移学习的目标，是利用一些不相关的数据，来提升目标任务。不相关主要包括task不相关。比如一个为猫狗分类器，一个为老虎狮子分类器data不相关。比如都为猫狗分类器，但一个来自

1 总览

迁移学习的目标，是利用一些不相关的数据，来提升目标任务。不相关主要包括

task不相关。比如一个为猫狗分类器，一个为老虎狮子分类器
data不相关。比如都为猫狗分类器，但一个来自真实的猫和狗照片，另一个为卡通的猫和狗

迁移学习中包括两部分数据

source data。和目标任务不直接相关，labeled或unlabeled数据一般比较容易获取，数据量很大。可以利用一些公开数据集，比如ImageNet。又比如在机器翻译任务中，中译英数据量很大，可以作为source data
target data。目标任务直接相关的数据，labeled或者unlabeled数据一般比较少。比如机器翻译任务中，中文翻译葡萄牙语，相对来说要少一些。

根据source data和target data，是否包含labeled data，我们又可以分为四类

机器学习14 -- 迁移学习 transfer learning

下面就一一介绍这四类case，和他们的处理方法

2 source和target都有标签

此时通常情况是，二者都有标签，但source data数据量比较大，而target data数据量比较少。假如target data数据量本身就比较大，那我们直接利用target data来训练模型就好了，不需要使用source data。此时常用两种方法

在source data上pretrain，然后在target data上fine-tune
source和target两个任务结合起来，做multi-task learning（MTL）

2.1 fine-tune

fine-tune模型微调的思想是，在source data上训练模型，然后在target data上进行微调。从而既可以从source data中学到大量知识，又可以适应target data特定任务。先用source data训练模型，然后利用这个模型参数初始化，然后在target data上继续训练下去。当target data特别少时，需要防止fine-tune 过拟合。

机器学习14 -- 迁移学习 transfer learning

layer transfer

当target data特别少时，fine-tune也有可能过拟合。此时可以使用layer transfer。

先利用source data训练一个模型
然后将模型的某些layer直接copy到target模型上。
再利用target data来训练target模型的剩余layer，之前copy过来的layer可以freeze住

此时只需要训练模型的少数几层，就没那么容易出现过拟合了。

机器学习14 -- 迁移学习 transfer learning

那么现在的问题就是，哪些layer需要被直接copy，而哪些则需要做fine-tune呢。这需要根据不同的任务来

语音识别中，一般直接copy最后几层，而fine-tune前面几层。这是因为不同人发音，由于口腔结构不同，低阶特征差别比较大，而语义和语言模型等高阶特征则相差不多。
图像任务中，一般直接copy前面几层，而fine-tune后面几层。这是因为图像中的光照、阴影等低阶特征一般差别不大，而高阶特征（比如大象的鼻子）则不同类别差别很大。

机器学习14 -- 迁移学习 transfer learning

2.2 multi-task learning 多任务学习

fine-tune只需要考虑模型在target data上的效果，而多任务学习则需要模型在source和target上表现都要比较好。

如果source和target输入特征比较相似，则可以共享前几层layer，后几层再在不同任务上单独处理。
如果source和target输入特征不同，则前几层layer和最后几层layer都可以使单独的，而共享中间几层layer。

机器学习14 -- 迁移学习 transfer learning

下面是机器翻译上的多任务学习的例子

机器学习14 -- 迁移学习 transfer learning

下图则证明了使用多任务学习，可以在相同数据量情况下，大大降低错误率。同时在数据量少一半的情况下，仍然可以达到单任务的效果。大大降低了模型对数据的依赖，同时提升了模型性能。

机器学习14 -- 迁移学习 transfer learning

3 target没有标签，但source有标签

此时可以利用领域对抗迁移，和零样本学习

3.1 Domain-adversarial Training 领域对抗训练

神经网络中的前面几层，一般是做特征抽取的。而后面几层则实现对应的任务，比如分类。我们的目标是特征抽取器对不同domain数据不敏感，将domain特有的信息去除掉，而尽量保留共性信息。

比如黑白背景的手写字识别，和彩色背景的手写字识别。二者domain差别比较大，直接用source模型来predict target数据，效果很差。主要就是受背景色不同影响。我们需要特征抽取器对背景不敏感，能真正抓住数字这个共性信息。

机器学习14 -- 迁移学习 transfer learning

那怎么做领域对抗训练呢，可以借鉴GAN的思想。如下图所示，整个网络包含三个部分

特征抽取器 feature extractor。它用来对不同domain数据提取特征
预测器 label predictor。它用来predict source data的label
领域分类器 domain classifier。它用来区分数据是来自source，还是target。

机器学习14 -- 迁移学习 transfer learning

我们的目标有两个

最大化label predict的ACC，这样保证模型在实际任务上的效果不会差
最小化domain classifier的ACC，使得模型尽量不能区分数据来自哪个domain。从而保证特征抽取器对不同domain不敏感。不提取domain私有的特征，而尽量提取不同domain的共性特征。

3.2 zero-shot learning 零样本学习

比如source是对猫狗进行分类，而target data中则出现了猴子。直接使用source模型显然是没法用的，因为连猴子这个label都是缺失的。此时我们可以使用zero-shot learning，不直接学习类别，而是类别的属性。比如我们可以创建一个table，属性为腿个数、有没有尾巴、有没有角，有没有毛等，而根据这些属性就可以确定类别为猫、狗、猴子。我们通过source来学习predict这些属性，然后利用属性查表来推测是哪个类别。

机器学习14 -- 迁移学习 transfer learning

4 source没有label，target有label

此时可以参考半监督学习了，但和半监督还是有比较大差别。半监督中的数据，其domain差别不大。我们这儿的source和target，其domain有一定的差别。可以利用source数据量大的特点，构建自监督学习任务，来学习特征表达。典型例子为NLP中的各种预训练模型。利用自监督学习，构建Auto-Encoder，在source上训练pretrain model。然后在target任务上进行fine-tune。详见

机器学习10 -- 半监督学习 Semi-supervised Learning

机器学习13 -- 无监督学习之自监督

5 source和target都没有label

此时主要就是聚类的范畴了，一般比较少碰到，就不说了。

推荐阅读

io
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
io
POJ 2482 星空中的星星：利用线段树与扫描线算法解决

在《POJ 2482 星空中的星星》问题中，通过运用线段树和扫描线算法，可以高效地解决星星在窗口内的计数问题。该方法不仅能够快速处理大规模数据，还能确保时间复杂度的最优性，适用于各种复杂的星空模拟场景。 ... [详细]

蜡笔小新 2024-11-09 12:09:08
io
PHP 对象生命周期与内存管理

本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用，包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]

蜡笔小新 2024-11-12 13:35:26
io
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
io
DRF框架中Serializer反序列化验证机制详解：深入探讨Validators的应用与优化

在DRF框架的反序列化验证机制中，除了基本的字段类型和长度校验外，还常常需要进行更为复杂的条件限制校验。通过引入`validators`模块，可以实现自定义校验逻辑，如唯一字段校验等。本文将详细探讨`validators`的使用方法及其优化策略，帮助开发者更好地理解和应用这一重要功能。 ... [详细]

蜡笔小新 2024-11-06 19:05:31
io
深入理解 Java 控制结构的全面指南

深入理解 Java 控制结构的全面指南 ... [详细]

蜡笔小新 2024-11-06 16:40:43
io
JavaScript XML操作实用工具类：XmlUtilsJS技巧与应用

JavaScript XML操作实用工具类：XmlUtilsJS技巧与应用 ... [详细]

蜡笔小新 2024-11-06 15:15:26
list
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
io
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
io
2019年斯坦福大学CS224n课程笔记：深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析

本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理（NLP）领域的应用，重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析，深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]

蜡笔小新 2024-10-29 10:37:07
io
Java Web Start应用中InvocationTargetException异常的深度解析与解决方案

Java Web Start应用中InvocationTargetException异常的深度解析与解决方案 ... [详细]

蜡笔小新 2024-10-22 11:21:14
io
Python中判断一个集合是否为另一集合子集的两种高效方法及其应用场景分析

Python中判断一个集合是否为另一集合子集的两种高效方法及其应用场景分析 ... [详细]

蜡笔小新 2024-11-11 19:27:53
io
CSS伪类详解：定义与应用

本文将深入解析CSS伪类的定义及其应用场景。CSS伪类通过为已存在的元素在特定状态下添加特殊样式，能够动态响应用户的交互行为，从而提升网页的视觉效果和用户体验。 ... [详细]

蜡笔小新 2024-11-08 17:49:37
function
HTML 页面中调用 JavaScript 函数生成随机数值并自动展示

在HTML页面中，通过调用JavaScript函数生成随机数值，并将其自动展示在页面上。具体实现包括构建HTML页面结构，定义JavaScript函数以生成随机数，以及在页面加载时自动调用该函数并将结果呈现给用户。 ... [详细]

蜡笔小新 2024-11-06 12:20:41
function
七款高效编辑器与笔记工具推荐：KindEditor自动换行功能解析

本文推荐了七款高效的编辑器与笔记工具，并详细解析了KindEditor的自动换行功能。其中，轻笔记QingBiJi是一款完全免费的记事本软件，用户可以通过其简洁的界面和强大的功能轻松记录和管理日常事务。此外，该软件还支持多平台同步，确保用户在不同设备间无缝切换。 ... [详细]

蜡笔小新 2024-11-06 11:14:53

JRamboKing

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章