百度ERNIE2.0发布！16项中英文任务表现超越BERT和XLNet

作者：留难龚_431 | 来源：互联网 | 2023-05-28 14:20

整理|夕颜出品|AI科技大本营（ID:rgznai100）导读：2019年3月，百度正式发布NLP模型ERNIE࿰

640?wx_fmt&＃61;png

整理 | 夕颜出品 | AI科技大本营&＃xff08;ID:rgznai100&＃xff09;

导读&＃xff1a;2019 年 3 月&＃xff0c;百度正式发布 NLP 模型 ERNIE&＃xff0c;其在中文任务中全面超越 BERT 一度引发业界广泛关注和探讨。今天&＃xff0c;百度发布了 ERNIE 2.0&＃xff0c;指出其在英文任务方面取得全新突破&＃xff0c;在共计 16 个中英文任务上超越了 BERT 和 XLNet&＃xff0c;取得了 SOTA 效果。目前&＃xff0c;ERNIE 2.0 代码和英文预训练模型已开源。

640?wx_fmt&＃61;png

&＃xff08;摄于2019年7月3日百度AI开发者大会&＃xff09;
今天&＃xff0c;百度 ERNIE 再度升级&＃xff0c;发布持续学习的语义理解框架 ERNIE 2.0&＃xff0c;及基于此框架的 ERNIE 2.0 预训练模型。目前&＃xff0c;百度 ERNIE 2.0 的Fine-tuning代码和英文预训练模型已开源。 Github 项目地址&＃xff1a;https://github.com/PaddlePaddle/ERNIE 近两年&＃xff0c;以BERT、XLNet为代表的无监督预训练技术在语言推断、语义相似度、命名实体识别、情感分析等多个自然语言处理任务上取得了技术突破。基于大规模数据的无监督预训练技术在自然语言处理领域变得至关重要。百度发现&＃xff0c;之前的工作主要通过词或句子的共现信号&＃xff0c;构建语言模型任务进行模型预训练。例如&＃xff0c;BERT 通过掩码语言模型和下一句预测任务进行预训练。XLNet 构建了全排列的语言模型&＃xff0c;并通过自回归的方式进行预训练。然而&＃xff0c;除了语言共现信息之外&＃xff0c;语料中还包含词法、语法、语义等更多有价值的信息。例如&＃xff0c;人名、地名、机构名等词语概念知识&＃xff0c;句子间顺序和距离关系等结构知识&＃xff0c;文本语义相似度和语言逻辑关系等语义知识。设想如果能持续地学习各类任务&＃xff0c;模型的效果能否进一步提升&＃xff1f;

640?wx_fmt&＃61;png

ERNIE 2.0&＃xff1a;可持续学习语义理解框架基于此&＃xff0c;百度提出可持续学习语义理解框架 ERNIE 2.0。该框架支持增量引入词汇(lexical)、语法 (syntactic) 、语义 (semantic) 等3个层次的自定义预训练任务&＃xff0c;能够全面捕捉训练语料中的词法、语法、语义等潜在信息。这些任务通过多任务学习对模型进行训练更新&＃xff0c;每当引入新任务时&＃xff0c;该框架可在学习该任务的同时&＃xff0c;不遗忘之前学到过的信息。这也意味着&＃xff0c;该框架可以通过持续构建训练包含词法、句法、语义等预训练任务&＃xff0c;持续提升模型效果。

640?wx_fmt&＃61;png

新发布的 ERNIE 2.0 模型结构依托该框架&＃xff0c;百度借助飞桨 PaddlePaddle 的多机分布式训练&＃xff0c;利用 79 亿 tokens 训练数据&＃xff08;约 1/4 的 XLNet 数据&＃xff09;和 64 张 V100 (约 1/8 的 XLNet 硬件算力)&＃xff0c;ERNIE 2.0 预训练模型不仅实现了 SOTA效果&＃xff0c;而且为开发人员定制自己的 NLP 模型提供了方案。百度研究团队分别比较了 ERNIE 2.0 在中英文环境上的模型效果。英文环境上&＃xff0c;ERNIE 2.0 在自然语言理解数据集 GLUE 的 7 个任务上击败了 BERT 和 XLNet。中文上&＃xff0c;在包括阅读理解、情感分析、问答等不同类型的 9 个数据集上超越了 BERT 并刷新了 SOTA。

640?wx_fmt&＃61;png

ERNIE 的工作表明&＃xff0c;在预训练过程中&＃xff0c;通过构建各层面的无监督预训练任务&＃xff0c;模型效果也会显著提升。未来&＃xff0c;研究者们可沿着该思路构建更多的任务提升效果。

自 2018 年预训练语言模型 BERT 提出之后&＃xff0c;预训练语言模型将自然语言处理的大部分任务水平提高了一个等级&＃xff0c;这个领域的研究也掀起了热潮。如今百度 ERNIE 2.0 再度为行业提供了研究思路上的方法创新&＃xff0c;可持续学习的特点亦将成为 NLP 领域发展里程中的注脚。

(*本文为 AI科技大本营整理文章&＃xff0c;转载请联系微信 1092722531)

◆

精彩推荐

◆

640?wx_fmt&＃61;jpeg

60&＃43;技术大咖与你相约 2019 AI ProCon&＃xff01;大会早鸟票已售罄&＃xff0c;优惠票速抢进行中......2019 AI开发者大会将于9月6日-7日在北京举行&＃xff0c;这一届AI开发者大会有哪些亮点&＃xff1f;一线公司的大牛们都在关注什么&＃xff1f;AI行业的风向是什么&＃xff1f;2019 AI开发者大会&＃xff0c;倾听大牛分享&＃xff0c;聚焦技术实践&＃xff0c;和万千开发者共成长。

推荐阅读

认知智能的突围&＃xff1a;NLP、知识图谱是AI下一个“掘金地”&＃xff1f;
你想见的大神都来AI ProCon 2019了&＃xff0c;优惠票限时抢购开启&＃xff01;
Python分析那些“标题党”文章
Python之父新发文&＃xff0c;将替换现有解析器
华为否认鸿蒙为噱头&＃xff1b;谷歌公布 6 大 iOS 漏洞&＃xff1b;极客头条
三次创业&＃xff0c;三次跨界&＃xff0c;这次凭十万行核心 C 代码登上 GitHub Top 1&＃xff01;
64%的投资者对比特币不感兴趣&＃xff0c;那是谁投资了比特币&＃xff1f;

你点的每个“在看”&＃xff0c;我都认真当成了喜欢

推荐阅读

数组
2019年后蚂蚁集团与拼多多面试经验详述与深度剖析

2019年后蚂蚁集团与拼多多面试经验详述与深度剖析 ... [详细]

蜡笔小新 2024-10-30 17:30:06
python
六个接私活的平台，技术在手，财富自由！值得推荐给每一位专业人士！

本文将介绍六个适合专业人士接私活的平台，帮助技术人才实现财富自由。这些平台不仅提供了丰富的项目机会，还为用户搭建了高效的合作桥梁，是每位技术人士不容错过的资源。 ... [详细]

蜡笔小新 2024-10-30 15:15:44
bit
利用Redis HyperLogLog高效统计微博日活跃和月活跃用户数

本文探讨了如何利用Redis的HyperLogLog数据结构高效地统计微博平台的日活跃用户（DAU）和月活跃用户（MAU）数量。通过HyperLogLog的高精度和低内存消耗特性，可以实现对大规模用户数据的实时统计与分析，为平台运营提供有力的数据支持。 ... [详细]

蜡笔小新 2024-10-29 10:15:22
python
为何Serverless将成为未来十年的主导技术领域？

为何Serverless将成为未来十年的主导技术领域？ ... [详细]

蜡笔小新 2024-10-28 09:23:05
python
CCF 100w+奖池大赛启动！百度高级工程师带你玩转NLP 、CV赛题！

2021年大数据与AI领域年度盛事——第九届CCF大数据与计算智能大赛已开赛近一个月，你的队伍是否已荣登top榜！百度发布NLP领域“千言-问题匹配鲁棒 ... [详细]

蜡笔小新 2024-09-28 11:59:18
python
老电影和图片变清晰的秘密！分辨率提升400%的AI算法

老电影和图片变清晰的秘密！分辨率提升400%的AI算法-如上图，从100x133pix→400x532pix，除了肉眼可见的清晰，拥有可以将分辨率提升400%的技术到底意味着什么 ... [详细]

蜡笔小新 2023-10-13 13:06:20
python
稳操胜券，35K薪资，字节跳动商业数据分析岗位

在数字化浪潮中，掌握数据即掌握未来。正如马云在IT领袖峰会上所言：“未来的竞争将是数据的竞争，只有实现业务的数据化和数据的业务化，企业才能在激烈的市场竞争中脱颖而出。”字节跳动的商业数据分析岗位，正是这一趋势的体现，提供35K的薪资，吸引着众多数据精英。 ... [详细]

蜡笔小新 2024-10-31 10:23:45
python
从用户转型为开发者：一场思维升级的旅程 | 专访 StarRocks Committer 周威

从用户转变为开发者，不仅是一次角色的转换，更是一场深刻的思维升级之旅。本次专访中，StarRocks Committer 周威分享了他如何在这一过程中逐步提升技术能力与思维方式，为开源社区贡献自己的力量。 ... [详细]

蜡笔小新 2024-10-31 09:21:44
js
六个关键步骤掌握Python数据分析，探索六款小众但强大的数据处理库

Python 数据分析领域不仅拥有高质量的开发环境，还提供了众多功能强大的第三方库。本文将介绍六个关键步骤，帮助读者掌握 Python 数据分析的核心技能，并深入探讨六款虽不广为人知但却极具潜力的数据处理库，如 Pandas 的替代品和新兴的可视化工具，助力数据科学家和分析师提升工作效率。 ... [详细]

蜡笔小新 2024-10-29 11:26:54
python
如何在jieba分词中加自定义词典_常见中文分词包比较

1jiebajieba.cut方法接受三个输入参数:需要分词的字符串；cut_all参数用来控制是否采用全模式；HMM参数用来控制是否使用HMM模型ji ... [详细]

蜡笔小新 2024-10-11 12:27:39
yaml
基于Python PaddleSpeech实现语音文字处理

基于Python PaddleSpeech实现语音文字处理-目录前言环境安装项目验证tts语音合成asr语音识别标点恢复总结前言这段时间一直在研究飞浆平台，最近试了试PaddleS ... [详细]

蜡笔小新 2024-09-24 17:30:27
yaml
聊聊中国人工智能科技产业区域竞争力分析及趋势

原文链接：聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数（2021ÿ ... [详细]

蜡笔小新 2023-10-13 11:56:40
yaml
百度AI Studio人流密度常规赛火热进行中，快来报名！

早晨七点半。北京初秋的凉风叫醒了住在望京西的你，睁开眼睛，一想到又要为人类的信息化事业贡献满满的正能量，你不禁哼唱起那句“早晨起来 ... [详细]

蜡笔小新 2023-10-12 18:57:29
process
python人物抠图算法_比PS还好用！Python 20行代码批量抠图

抠图前vsPython自动抠图后在日常的工作和生活中，我们经常会遇到需要抠图的场景，即便是只有一张图片需要抠，也会抠得我们不耐烦ÿ ... [详细]

蜡笔小新 2023-10-12 18:22:39
email
华为200万年薪招聘AI应届生——有多少本事，给多少钱

据新浪科技报道，阿里AIlabs年薪百万美元引进两位科学家。除AI顶尖科学家外，华为也是为多位AI应届博士开出了200万的高价年薪。19年9月，各大互联招聘企业陆续发布2019年人 ... [详细]

蜡笔小新 2023-10-11 14:19:53