热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

AIStudio精品项目合集|NLP领域的Transformer实践

在2017年,Transformer模型由论文《Attentionisallyouneed》提出,最开始被应用于机器翻译任务上并取得了很好的效果。它摒弃

在2017年,Transformer模型由论文《Attention is all you need》提出,最开始被应用于机器翻译任务上并取得了很好的效果。它摒弃了传统LSTM的串行结构,使用了基于Self Attention的模型结构,具有更好的并行计算能力,这使得它在大规模数据模型训练方面更有优势。

后来基于Transformer结构的模型大放异彩,特别是在2018年预训练模型BERT的提出,其在多项NLP任务上均取得了突破性的进展,具有里程碑式的意义。自此,不管是学术界,还是工业界均掀起了基于Transformer的预训练模型研究和应用的热潮,并且逐渐从NLP延伸到CV、语音等多项领域。各种基于Transformer结构的变体模型在模型结构、运行效率和不同领域模型应用等方面纷纷被提出,同时各个领域的多项任务指标更是不断被刷新,深度学习领域进入了一个新的时代。

本期我们将展现Transformer类模型实现的4款NLP案例实践,包括机器翻译、阅读理解、文本分类和情感分析。如果你对这些内容感兴趣,赶快来一起学习吧。

Transformer在

机器翻译上的应用

机器翻译(machine translation, MT)是用计算机来实现不同语言之间翻译的技术。被翻译的语言通常称为源语言(source language),翻译成的结果语言称为目标语言(target language)。机器翻译即实现从源语言到目标语言转换的过程,是自然语言处理的重要研究领域之一。一般而言,机器翻译的建模方式如下图所示,给定源语言,期望模型能够翻译成目标语言。

0f2026703fbf9df02783ac80798509c1.png

本项目先带领大家解读Transformer的基本原理,然后剖析Transformer在机器翻译上应用的机制,最后讲解基于Transformer的机器翻译的代码实践,即在中英文数据集IWSLT 2015上训练训练一个机器翻译模型。

项目维护者:PaddleEdu

主要框架/模型库:飞桨核心框架PaddlePaddle,飞桨自然语言处理模型库PaddleNLP

项目链接:

https://aistudio.baidu.com/aistudio/projectdetail/2311016

ERNIE模型在

阅读理解中的应用

机器阅读理解(Machine Reading Comprehension) 是指让机器阅读文本,然后回答和阅读内容相关的问题。阅读理解是自然语言处理和人工智能领域的重要前沿课题,对于提升机器的智能水平、使机器具有持续知识获取的能力等具有重要价值,近年来受到学术界和工业界的广泛关注。

阅读理解的经典建模方式如下图所示,给定一篇文章和一个问题,期望模型能够从这篇文章中找出该问题对应的答案。

adc9176a2a4ec75105e798f5b8e7ea29.png

本案例使用ERNIE在DuReader_robust数据集上实现了阅读理解任务。ERNIE是百度发布一款预训练模型,它通过引入三种级别的Knowledge Masking帮助模型学习语言知识,并且在多项NLP任务上超越了BERT。当使用ERNIE模型进行阅读理解任务会达到什么样的效果,赶快来看看吧。

项目维护者:PaddleEdu

主要框架/模型库:飞桨核心框架PaddlePaddle,飞桨自然语言处理模型库PaddleNLP

项目链接:

https://aistudio.baidu.com/aistudio/projectdetail/2333137

基于ERNIE实现

9项GLUE任务

The General Language Understanding Evaluation benchmark (GLUE) 是一个被广为使用的经典数据集合,其包含多项子数据集,如下图所示,这些数据集经常被用来验证各项NLP模型性能。

aed879f74e901d7d41ebaf79c0add5de.png

本实验将基于ERNIE模型对以上的9项GLUE任务进行训练,ERNIE在预训练过程中增加了Knowledge Masking帮助模型学习语言知识,相比BERT,其具有更强的语言理解能力。希望本案例能够帮助大家了解ERNIE模型在这9项任务上的实现以及相应表现。

项目维护者:PaddleEdu

主要框架/模型库:飞桨核心框架PaddlePaddle,飞桨自然语言处理模型库PaddleNLP

项目链接:

https://aistudio.baidu.com/aistudio/projectdetail/2345396

XLNet模型在

情感分析中的应用

自然语言是人类传递信息的一种载体,同时它也能表达人类交流时的情感。一段对话或者一句评论都能蕴含着丰富的感情色彩:比如高兴、快乐、喜欢、讨厌、忧伤等等。如下图所示,利用机器自动分析这些情感倾向,不但有助于帮助企业了解消费者对其产品的感受,为产品改进提供依据;同时还有助于企业分析商业伙伴们的态度,以便更好地进行商业决策。通常情况下,我们往往将情感分析任务定义为一个分类问题,即使用计算机判定给定的一段文字所表达的情感属于积极情绪,还是消极情绪。

feaca276801fe835909cc7bd1567525f.png

本实验将使用XLNet模型在IMDB电影评论数据集上建模情感分析,XLNet模型是一种能看得见双向信息的广义自回归模型,并且在建模过程中引入了Segment循环机制,从而保证模型能够建模更长的文本序列依赖关系。该情感分析任务有助于帮助消费者了解一部电影的质量,也可用于电影的推荐。

项目维护者:PaddleEdu

主要框架/模型库:飞桨核心框架PaddlePaddle,飞桨自然语言处理模型库PaddleNLP

项目链接:

https://aistudio.baidu.com/aistudio/projectdetail/2333184

了解更多

更多Transformer类模型在NLP领域的理论及实践内容,欢迎访问下方链接查看。上述案例使用过程中如有任何问题,可以点击阅读原文提issue,或者扫描下方二维码加入QQ群交流,目前已有2100+同学一起学习。

合集地址:

https://aistudio.baidu.com/aistudio/projectdetail/2277159

5991fad3363d79b5479337dbb269b0cf.png

6c7f1a39fe241dc542904ec3bb8176be.png

长按下方二维码立即

Star

adaaacb6069b86b96877b68ed898a28c.png

更多信息:

  1. 飞桨官方QQ群:793866180

  2. 飞桨官网网址:

    www.paddlepaddle.org.cn/

  3. 飞桨开源框架项目地址:

    GitHub:

    github.com/PaddlePaddle/Paddle 
    Gitee:

    gitee.com/paddlepaddle/Paddle

  4. 欢迎在飞桨论坛讨论交流~~

    http://discuss.paddlepaddle.org.cn



推荐阅读
  • 【图像分类实战】利用DenseNet在PyTorch中实现秃头识别
    本文详细介绍了如何使用DenseNet模型在PyTorch框架下实现秃头识别。首先,文章概述了项目所需的库和全局参数设置。接着,对图像进行预处理并读取数据集。随后,构建并配置DenseNet模型,设置训练和验证流程。最后,通过测试阶段验证模型性能,并提供了完整的代码实现。本文不仅涵盖了技术细节,还提供了实用的操作指南,适合初学者和有经验的研究人员参考。 ... [详细]
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • 基于OpenCV的小型图像检索系统开发指南
    本文详细介绍了如何利用OpenCV构建一个高效的小型图像检索系统,涵盖从图像特征提取、视觉词汇表构建到图像数据库创建及在线检索的全过程。 ... [详细]
  • 本文介绍了在解决Hive表中复杂数据结构平铺化问题后,如何通过创建视图来准确计算广告日志的曝光PV,特别是针对用户对应多个标签的情况。同时,详细探讨了UDF的使用方法及其在实际项目中的应用。 ... [详细]
  • 我整理了HMOV四大5G旗舰的参数,可依然没能拯救我的选择困难症
    伊瓢茕茕发自凹非寺量子位报道|公众号QbitAI报道了那么多发布会,依然无法选出要换的第一部5G手机。这不,随着华为P40系列发布,目前国 ... [详细]
  • 计算机学报精选论文概览(2020-2022)
    本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文,旨在为即将投稿的研究者提供参考。 ... [详细]
  • 机器学习(ML)三之多层感知机
    深度学习主要关注多层模型,现在以多层感知机(multilayerperceptron,MLP)为例,介绍多层神经网络的概念。隐藏层多层感知机在单层神经网络的基础上引入了一到多个隐藏 ... [详细]
  • SDWebImage第三方库学习
    1、基本使用方法异步下载并缓存-(void)sd_setImageWithURL:(nullableNSURL*)urlNS_REFINED_FOR_SWIFT;使用占位图片& ... [详细]
  • 分享两个GitHub链接,今天看到的,超赞超赞不能更赞了,答应我一定要去看好吗~~~~不论是笔记还是github中分享的其它资源ÿ ... [详细]
  • 自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析
    目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]
  • 本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节,作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识,为后续的机器学习应用打下坚实的基础。 ... [详细]
  • 本文介绍如何使用OpenCV和线性支持向量机(SVM)模型来开发一个简单的人脸识别系统,特别关注在只有一个用户数据集时的处理方法。 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • 在2019中国国际智能产业博览会上,百度董事长兼CEO李彦宏强调,人工智能应务实推进其在各行业的应用。随后,在“ABC SUMMIT 2019百度云智峰会”上,百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]
  • 计算机视觉领域介绍 | 自然语言驱动的跨模态行人重识别前沿技术综述(上篇)
    本文介绍了计算机视觉领域的最新进展,特别是自然语言驱动的跨模态行人重识别技术。上篇内容详细探讨了该领域的基础理论、关键技术及当前的研究热点,为读者提供了全面的概述。 ... [详细]
author-avatar
家具销售_903
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有