热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

百度文心多项任务分数刷新GLUE榜单,NLP界的“MVP”再次夺冠

近日,自然语言处理领域权威排行榜——GLUE(通用语言理解评估基准)新排名出炉。百度自研的语义理解技术与平台文心ERNIE以90.9的分数

近日,自然语言处理领域权威排行榜——GLUE(通用语言理解评估基准)新排名出炉。百度自研的语义理解技术与平台文心 ERNIE 以90.9的分数再登榜首,领先微软 DeBERTa/TuringNLRv4、谷歌 T5 以及阿里巴巴、华为等研发的其他同类别技术。

图片

GLUE 排行榜由纽约大学、华盛顿大学、谷歌 DeepMind 等机构联合推出,涵盖自然语言推断、语义相似度、问答匹配、情感分析等9大不同类型的 NLP 任务。GLUE 榜单的挑战者包含了谷歌、Facebook、微软等国际顶尖科技公司以及斯坦福大学、卡耐基·梅隆大学等知名高校,含金量极高。GLUE 榜单在一定程度上成为了衡量各机构自然语言处理预训练技术水平最重要的指标之一。

 首创层次化学习 

早在2019年12月,百度文心 ERNIE 就曾以9个任务平均得分首次突破90大关的好成绩,刷新 GLUE 榜单历史夺得榜首。此次百度文心 ERNIE 再度登顶,主要源于文心 ERNIE 对模型持续学习方式的进一步升级和模型神经元数目的进一步增多,使得模型能更加高效地、高质量地学习海量数据中的丰富知识。具体来说,文心 ERNIE 提出了层次化 Post-LN Transformer 算法,解决了大规模 Post-LN Transformer 模型训练不稳定问题,保证了模型训练效果。此外,文心 ERNIE 还利用了百度飞桨独创的 Hybrid Sharding 分布式算法,极大地降低了模型训练时间。

图片

▲ 文心 ERNIE 层次化 Post-LN Transformer 技术图解

 业界领先的语义理解技术与平台 ——文心 ERNIE 

自然语言处理(NLP)被称为人工智能皇冠上的一颗明珠,该领域的技术突破对于机器认知智能发展至关重要。百度文心 ERNIE 则是一个取得世界级突破的语义理解技术与平台,它依托于百度的深度学习平台飞桨打造,将机器理解语言的水平提升到一个新的高度,为计算机带来了认知智能领域的巨大跨域。此次文心 ERNIE 能够再次超越国际顶尖公司及高校荣登榜首,背后是百度在 NLP 技术的长期积累。

文心 ERNIE 的核心技术优势在于,它开创性地将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇、结构、语义等方面的新知识,实现模型效果不断进化,如同人类持续学习一样。这让它在16个中英文典型 NLP 任务上显著超越当时世界最好效果。

文心 ERNIE 语义理解平台集先进的预训练模型、全面的 NLP 算法集、端到端开发套件和平台化服务于一体,为企业和开发者提供一站式 NLP 开发与服务。

图片

如今,百度在自然语言处理领域的深厚积累已辐射至不同领域。文心 ERNIE 已广泛地应用于百度内外多个产品和技术场景,在百度搜索、小度音箱、信息流推荐等一系列产品应用中发挥了重要作用,大幅提升了产品效果和用户体验,并通过百度智能云形成“云智一体”的竞争优势,输送到金融、通信、教育、互联网等行业,助力各行各业产业智能化升级。


推荐阅读
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 微信回应「10 元就能在朋友圈改定位」;谷歌官方首次提及 Android 11;Node 8.16.2 发布 | 极客头条...
    微信回应「10元就能在朋友圈改定位」;谷歌官方首次提及Android11;Node8.16.2发布|极客头条,Go语言社区,Golang程序员人脉社 ... [详细]
  • CodeBERT理解
    1.动机大型的预训练模型,比如ELMo、GPT、Bert等提高了NLP任务的最新技术。这些预训练模型在NLP的成功驱动了多模态预训练模型,比如ViBE ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 本文介绍了RPC框架Thrift的安装环境变量配置与第一个实例,讲解了RPC的概念以及如何解决跨语言、c++客户端、web服务端、远程调用等需求。Thrift开发方便上手快,性能和稳定性也不错,适合初学者学习和使用。 ... [详细]
  • Java和JavaScript是什么关系?java跟javaScript都是编程语言,只是java跟javaScript没有什么太大关系,一个是脚本语言(前端语言),一个是面向对象 ... [详细]
  • 开发笔记:Python之路第一篇:初识Python
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了Python之路第一篇:初识Python相关的知识,希望对你有一定的参考价值。Python简介& ... [详细]
  • Hadoop源码解析1Hadoop工程包架构解析
    1 Hadoop中各工程包依赖简述   Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章,介绍了它们的计算设施。   GoogleCluster:ht ... [详细]
  • OAuth2.0指南
    引言OAuth2.0是一种应用之间彼此访问数据的开源授权协议。比如,一个游戏应用可以访问Facebook的用户数据,或者一个基于地理的应用可以访问Foursquare的用户数据等。 ... [详细]
  • yahoo对付伪造跨站请求的办法是在表单里加入一个叫.crumb的随机串;而facebook也有类似的解决办法,它的表单里常常会有post_form_i ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了Flutter添加APP启动StoryView相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 干货 | 携程AI推理性能的自动化优化实践
    作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品,其中性能优化组为AI模型提供全方位的优化方案,提升推理性能降低成本࿰ ... [详细]
  • vlfilecopy(findfile(vllist>string(10811110311146103105102)))(vll的简单介绍
    本文目录一览:1、一段lisp代码求解释2、运 ... [详细]
  • NLP如何进阶?你应该先掌握四大基本任务!
    “语言理解是人工智能领域皇冠上的明珠。”——比尔盖茨自然语言处理是一门综合性的学问,它远远不止机器学习算法。相比图像或语音,文本的变化更加复杂ÿ ... [详细]
author-avatar
只是遇不到他_740
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有