热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

《中国人工智能学会通讯》——11.76基于深度学习的特征表示模型

11.76基于深度学习的特征表示模型随着数据规模不断增大,深度学习在大数据分析中扮演着越来越重要的角色。图5显示了数据规模与性能之间的关系,传统学习算法在数据规模达到一定时性能几乎

11.76 基于深度学习的特征表示模型

随着数据规模不断增大,深度学习在大数据分析中扮演着越来越重要的角色。图 5 显示了数据规模与性能之间的关系,传统学习算法在数据规模达到一定时性能几乎不再增加,而深度学习算法的性能会随着数据规模增加而增加。通过深度学习进行特征表示学习已经成为了机器学习和数据挖掘社区的一个快速突起的方法,并已经在许多领域获得成功,如计算机视觉、语音识别和自然语言处理等。蒙特利尔大学 Bengio 教授在文献 [8] 中综述了这方面的最新进展。《中国人工智能学会通讯》——11.76 基于深度学习的特征表示模型
许多深度神经网络模型,如自编码器和受限玻尔兹曼机,均采用无监督学习的模式。举例来说,一个自编码器通过数据自身重构的方式来学习优化网络参数。另一方面,深度神经网络也可以采用监督学习模式,如纽约大学 LeCun 教授提出的卷积神经网络[10] 。然而,在 2006 年之前大多数监督学习模式的深度网络均不是很成功。事实证明,多层神经网络的预测能力往往比浅层学习模型(如 SVM)更差。2006 年,多伦多大学 Hinton 教授革命性地提出了深度置信网络(Deep Belief Network,DBN),一种非监督式的逐层贪心训练算法,为有效训练深度神经网络带来了希望。之后,多种深度神经网络被提出,如堆栈式降噪自编码器(StackedDenoising Autoencoders,SDAE) [11] 。这些深度学习模型往往采用无监督学习模型,已经被证明可以有效学习高层次表征。机器学习,尤其是分类和回归问题的主要目标是估计条件分布 P(Y|X)。所有基于无监督学习的预训练方法都基于一个假设:输入数据的边缘分布 P(X) 包含了关于条件分布P(Y|X) 的重要信息[12] 。当存在大量标记数据时,有监督学习方法往往非常有效。当只有少量标记数据而无标记数据可以轻易获取时,结合已有标记数据和大量无标记数据将能增加对边缘分布 P(X) 估计的准确性。图 6 给出了一个线性特征空间的实例(图中,(a) 无监督学习——仅使用无标记数据;(b)监督学习——仅使用标记数据;(c) 半监督学习——同时使用标记数据和无标记数据。圆圈表示无标记数据;三角、方块、五角星表示不同的标记数据),其中潜在表征可以仅通过无标记数据或标记数据学习得到,也可以同时从两者学习得到。不难发现,无监督学习方式可以更好地刻画数据分布;监督学习可以很好地进行分类,但是不能确保与本质的数据分布一致;半监督学习方式可以同时利用标记数据和无标记数据进行协同训练,有利于产生好的表征。《中国人工智能学会通讯》——11.76 基于深度学习的特征表示模型
经典的自编码器及其变种往往采用无监督学习方式,为使其同样可以使用标记数据,受到一些基于弱监督学习或半监督学习的自编码器算法[13-15]的启发,我们提出了一种新的学习模型,命名为SUGAR(Supervision-Guided AutoencodeR) [16] 。 图 7给出了相应网络结构图,主要包括以下三个部分。

● 主网络 (Main Network):用于重构输入,即无监督的自编码器;

● 辅助网络 (Auxiliary Network):基于对象间相似性,用于正则化学习到的网络,即有监督学习;

● 桥 (Bridge): 用于连接主网络和辅助网络,目的是增强两个网络之间参数的相关性。《中国人工智能学会通讯》——11.76 基于深度学习的特征表示模型
具体地,主网络使用无标记数据,可以采用正则自编码器(或降噪自编码器[11] );辅助网络使用标记数据(如成对标记),可以采用监督式学习方式(如哈希学习[17] );桥连接上面两部分,迫使它们的参数逼近。

基于 SUGAR 模型,我们给出了深度学习模型DeepSUGAR,如图 8 所示。DeepSUGAR 采用堆栈方式,将多个SUGAR堆起来形成一个深度学习模型,主要分为预训练和微调两个阶段。DeepSUGAR 的每一层是 SUGAR 模型,由主网络(实线框)、辅助网络(虚线框)和桥三个组件构成。f、h 表示编码函数,g 为解码函数,C 为区分函数。预训练后,所有虚线部分(包括 g 和 h)将被丢弃,整个系统通过编码函数 f 采用前馈传递方式产生紧致表征。《中国人工智能学会通讯》——11.76 基于深度学习的特征表示模型
我们在 8 个基准数据集上验证了模型的有效性。


推荐阅读
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • 非计算机专业的朋友如何拿下多个Offer
    大家好,我是归辰。秋招结束后,我已顺利入职,并应公子龙的邀请,分享一些秋招面试的心得体会,希望能帮助到学弟学妹们,让他们在未来的面试中更加顺利。 ... [详细]
  • 在2019中国国际智能产业博览会上,百度董事长兼CEO李彦宏强调,人工智能应务实推进其在各行业的应用。随后,在“ABC SUMMIT 2019百度云智峰会”上,百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性,但Python作为一种通用编程语言,适用于更广泛的领域,包括Web开发、自动化脚本和机器学习等。对于初学者而言,Python的学习曲线更为平缓,上手更加容易。此外,Python拥有庞大的社区支持和丰富的第三方库,使其在实际应用中更具灵活性和扩展性。 ... [详细]
  • 本文介绍了实现人工智能的多种方法,并重点探讨了当前最热门的技术——通过深度学习训练神经网络。文章通过具体实例详细解释了神经网络的基本原理及其应用。 ... [详细]
  • 本文介绍如何使用OpenCV和线性支持向量机(SVM)模型来开发一个简单的人脸识别系统,特别关注在只有一个用户数据集时的处理方法。 ... [详细]
  • 理工科男女不容错过的神奇资源网站
    十一长假即将结束,你的假期学习计划进展如何?无论你是在家中、思念家乡,还是身处异国他乡,理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档,能够帮助你在假期中高效学习和提升专业技能。 ... [详细]
  • 图像分割技术在人工智能领域中扮演着关键角色,其中语义分割、实例分割和全景分割是三种主要的方法。本文对这三种分割技术进行了详细的对比分析,探讨了它们在不同应用场景中的优缺点和适用范围,为研究人员和从业者提供了有价值的参考。 ... [详细]
  • AI TIME联合2021世界人工智能大会,共探图神经网络与认知智能前沿话题
    AI TIME携手2021世界人工智能大会,共同探讨图神经网络与认知智能的最新进展。自2018年在上海首次举办以来,WAIC已成为全球AI领域的年度盛会,吸引了众多专家学者和行业领袖参与。本次大会将聚焦图神经网络在复杂系统建模、知识图谱构建及认知智能应用等方面的技术突破和未来趋势。 ... [详细]
  • 视觉图像的生成机制与英文术语解析
    近期,Google Brain、牛津大学和清华大学等多家研究机构相继发布了关于多层感知机(MLP)在视觉图像分类中的应用成果。这些研究深入探讨了MLP在视觉任务中的工作机制,并解析了相关技术术语,为理解视觉图像生成提供了新的视角和方法。 ... [详细]
author-avatar
霍任芳
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有