热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

迁移学习系列有监督无监督迁移

一.域对抗性模型1.域对抗方式应对于源场景是有监督的、目标场景是无监督的学习问题,如下图是从数据集MNIST到MNIST-IN的迁移应用,通过有监督的

一.域对抗性模型

1.域对抗方式应对于源场景是有监督的、目标场景是无监督的学习问题,如下图是从数据集MNIST到MNIST-IN的迁移应用,通过有监督的MNIST数据来实现对有背景MNIST-IN图片的数字识别。

2.对于有标签到无标签的迁移问题,我们可以借用GAN的思想,构造下面的网络结构,创造这个模型的思路是:              

       [1]首先构建一个CNN网络模型,模型可以分为特征提取器和分类标签预测、域分类三大部分。                

       [2]我们会使用有监督的源场景数据进行上面部分网络的训练(我们只有源数据有标签),上面部分训练的目标是使得源场景的预测效果尽量好,会计算损失值进行梯度调参。            

        [3]下面的网络用于进行二分类,用于判断现在输入的样本是属于源场景还是目标场景, 下面网络训练的目标是尽量能识别出输入的数据属于哪个场景。

3.我们通过构建上面的网络结构,训练的目标函数是最大化标签分类的准确率、最大化域分类准确率。

       *训练的最终目的是最大化标签分类的准确率、最小化域分类能力,也就是让下面的域分类器分不出来现在的数据属于哪个域,这样就可以说明对于这个网络两个域已经足够接近,抹去了域的区别作用,前面的特征提取部分具有针对两个域的特征提取效果,之后我们就可以使用上面训练好的网络在目标场景上进行分类预测。

       *进行网络的优化时,会使用源任务和目标任务的数据集,走上面网络进行训练时只能使用源任务的数据,构造损失函数进行SGD反向调参。

       *在进行域分类网络训练时(数据很多),计算统一的损失值,但是进行网络更新时是不同的,在域分类部分参数更新的目的是使得域分类损失函数变小,在特征提取部分更新的目的是使得域分类损失函数值变大,所以会在原来的SGD求梯度式子上加了负号。

4.使用域对抗训练的效果如下,可以发现对于Mnist数据集到Mnist-M的迁移上,只使用源任务训练好的的网络进行预测时,只达到了57%的准确率,而是用域对抗方式后,训练的准确率能达到81%。


二.零样本学习

1.零样本学习是针对目标场景无监督迁移的另一种方式。

        零样本的基本思想是针对一个粒度(如动物),对动物的属性进行切分,让神经网络的输出是各个属性,这样我们就可以根据神经网络输出的效果和外界提供的知识库来判断输入的动物图像是什么种类。

2.可以看出这个模型有两大分布:对知识库表的构建(人采集)、对神经网络的训练。

        *知识库类似于左图的图表结构,里面会包含动物属性和动物类别的一一对应,表内的属性刻画的越详细越好,越详细对不同动物之间的区分效果越好,一般这样的知识表是非常稀疏的。

        *对于神经网络的优化会使用大量有标签的动物数据进行训练,神经网络的目标并不是识别输入图像属于哪个动物,而是识别出输入图像的属性。

3.对于训练出的神经网络的理解,可以想成是原始图片的大量特征映射到低纬稠密空间中(压缩成的特征数是NN输出的神经元数量)。

        *如下图对压缩形式的展示,f(x)代表NN的输出特征向量,g(y)代表知识库中相应动物的特征向量,我们的目标是使得动物的NN输出特征和知识库中的特征向量尽量接近。

        *设定的损失函数如下,我们既要令训练数据的f(x)和g(y)尽量接近,同时也要保持f(x)与其他动物的标签向量g(y')有一定的距离。

                     

         

 


推荐阅读
  • 卷积神经网络(CNN)基础理论与架构解析
    本文介绍了卷积神经网络(CNN)的基本概念、常见结构及其各层的功能。重点讨论了LeNet-5、AlexNet、ZFNet、VGGNet和ResNet等经典模型,并详细解释了输入层、卷积层、激活层、池化层和全连接层的工作原理及优化方法。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • Python自动化处理:从Word文档提取内容并生成带水印的PDF
    本文介绍如何利用Python实现从特定网站下载Word文档,去除水印并添加自定义水印,最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]
  • 本文介绍如何使用 Python 提取和替换 .docx 文件中的图片。.docx 文件本质上是压缩文件,通过解压可以访问其中的图片资源。此外,我们还将探讨使用第三方库 docx 的方法来简化这一过程。 ... [详细]
  • 帝国CMS多图上传插件详解及使用指南
    本文介绍了一款用于帝国CMS的多图上传插件,该插件通过Flash技术实现批量图片上传功能,显著提升了多图上传效率。文章详细说明了插件的安装、配置和使用方法。 ... [详细]
  • PHP 5.5.0rc1 发布:深入解析 Zend OPcache
    2013年5月9日,PHP官方发布了PHP 5.5.0rc1和PHP 5.4.15正式版,这两个版本均支持64位环境。本文将详细介绍Zend OPcache的功能及其在Windows环境下的配置与测试。 ... [详细]
  • Win11扩展卷无法使用?解决扩展卷灰色问题的指南
    本文详细介绍了在Windows 11中遇到扩展卷灰色无法使用时的解决方案,帮助用户快速恢复磁盘扩展功能。 ... [详细]
  • 探索12个能显著提升iPhone使用体验的隐藏技巧,掌握这些功能后,你会发现生活更加便捷高效。 ... [详细]
  • 网易严选Java开发面试:MySQL索引深度解析
    本文详细记录了网易严选Java开发岗位的面试经验,特别针对MySQL索引相关的技术问题进行了深入探讨。通过本文,读者可以了解面试官常问的索引问题及其背后的原理。 ... [详细]
  • 本文详细介绍了在企业级项目中如何优化 Webpack 配置,特别是在 React 移动端项目中的最佳实践。涵盖资源压缩、代码分割、构建范围缩小、缓存机制以及性能优化等多个方面。 ... [详细]
  • 尽管深度学习带来了广泛的应用前景,其训练通常需要强大的计算资源。然而,并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下(如ARM CPU)高效运行深度神经网络,特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]
  • 深入解析Redis内存对象模型
    本文详细介绍了Redis内存对象模型的关键知识点,包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析,帮助读者全面理解Redis内存管理机制。 ... [详细]
  • Python处理Word文档的高效技巧
    本文详细介绍了如何使用Python处理Word文档,涵盖从基础操作到高级功能的各种技巧。我们将探讨如何生成文档、定义样式、提取表格数据以及处理超链接和图片等内容。 ... [详细]
  • 雨林木风 GHOST XP SP3 经典珍藏版 V2017.11
    雨林木风 GHOST XP SP3 经典珍藏版 V2017.11 ... [详细]
  • 本文详细介绍了福昕软件公司开发的Foxit PDF SDK ActiveX控件(版本5.20),并提供了关于其在64位Windows 7系统和Visual Studio 2013环境下的使用方法。该控件文件名为FoxitPDFSDKActiveX520_Std_x64.ocx,适用于集成PDF功能到应用程序中。 ... [详细]
author-avatar
VASTEw
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有