当前位置: 开发笔记 > 后端 > 正文

中文哈工大_哈工大讯飞联合实验室发布中文BERTwwmext预训练模型

作者：不想与你见面_637 | 来源：互联网 | 2023-09-02 20:28

哈工大讯飞联合实验室(HFL)发布在更大规模语料上训练的基于全词Mask的中文预训练模型BERT-wwm-ext。该模型在多项基准测试上获得了进一步性能提升。我们欢迎各界同行下载使

哈工大讯飞联合实验室(HFL)发布在更大规模语料上训练的基于全词Mask的中文预训练模型BERT-wwm-ext。该模型在多项基准测试上获得了进一步性能提升。我们欢迎各界同行下载使用。

下载地址&＃xff1a;https://github.com/ymcui/Chinese-BERT-wwm

摘要

哈工大讯飞联合实验室在2019年6月20日发布了基于全词Mask的中文预训练模型BERT-wwm&＃xff0c;受到业界广泛关注及下载使用。为了进一步提升中文自然语言处理任务效果&＃xff0c;推动中文信息处理发展&＃xff0c;我们收集了更大规模的预训练语料用来训练BERT模型&＃xff0c;其中囊括了百科、问答、新闻等通用语料&＃xff0c;总词数达到5.4B。通过初步实验&＃xff0c;我们可以看到采用了更多数据训练并且加大训练步数可以进一步带来性能提升。BERT-wwm-ext采用了与BERT以及BERT-wwm一样的模型结构&＃xff0c;同属base模型&＃xff0c;由12层Transformers构成。训练第一阶段(最大长度为128)采用的batch size为2560&＃xff0c;训练了1M步。训练第二阶段(最大长度为512)采用的batch size为384&＃xff0c;训练了400K步。

基线测试结果

中文简体阅读理解&＃xff1a;CMRC 2018

CMRC 2018是哈工大讯飞联合实验室发布的中文机器阅读理解数据。根据给定问题&＃xff0c;系统需要从篇章中抽取出片段作为答案&＃xff0c;形式与SQuAD相同。本实验中可以看到&＃xff0c;BERT-wwm模型显著优于BERT和ERNIE。使用了更大规模数据训练的BERT-wwm-ext则会带来进一步性能提升。

中文繁体阅读理解&＃xff1a;DRCD

DRCD数据集由中国台湾台达研究院发布&＃xff0c;其形式与SQuAD相同&＃xff0c;是基于繁体中文的抽取式阅读理解数据集。可以看到BERT-wwm-ext带来非常显著的性能提升。值得注意的是新加入的训练语料中不包含繁体中文数据&＃xff0c;繁体中文仅存在于中文维基百科数据中。

自然语言推断&＃xff1a;XNLI

在自然语言推断任务中&＃xff0c;我们采用了XNLI数据。可以看到BERT-wwm-ext与ERNIE在该任务上的效果较好。

原文、编辑&＃xff1a;HFL编辑部

推荐阅读

go
golang常用库：配置文件解析库/管理工具viper使用

golang常用库：配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库，是由大神SteveFrancia开发，他在google领导着golang的 ... [详细]

蜡笔小新 2024-12-28 13:47:52
go
扫描线三巨头 hdu1928hdu 1255 hdu 1542 [POJ 1151]

学习链接：http:blog.csdn.netlwt36articledetails48908031学习扫描线主要学习的是一种扫描的思想，后期可以求解很 ... [详细]

蜡笔小新 2024-12-26 20:04:36
go
HTML Attribute Naming Conventions for Fast Components

This document outlines the recommended naming conventions for HTML attributes in Fast Components, focusing on readability and consistency with existing standards. ... [详细]

蜡笔小新 2024-12-26 19:13:45
go
告别传统文件传输，迎接新一代高效工具Croc

在现代网络环境中，两台计算机之间的文件传输需求日益增长。传统的FTP和SSH方式虽然有效，但其配置复杂、步骤繁琐，难以满足快速且安全的传输需求。本文将介绍一种基于Go语言开发的新一代文件传输工具——Croc，它不仅简化了操作流程，还提供了强大的加密和跨平台支持。 ... [详细]

蜡笔小新 2024-12-26 16:16:06
go
解决微信电脑版无法刷朋友圈问题：使用安卓远程投屏方案

在工作期间想要浏览微信和朋友圈却不太方便？虽然微信电脑版目前不支持直接刷朋友圈，但通过远程投屏技术，可以轻松实现在电脑上操作安卓设备的功能。 ... [详细]

蜡笔小新 2024-12-26 15:23:19
go
从零开始构建完整手机站：Vue CLI 3 实战指南（第一部分）

本系列教程将引导您使用 Vue CLI 3 构建一个功能齐全的移动应用。我们将深入探讨项目中涉及的每一个知识点，并确保这些内容与实际工作中的需求紧密结合。 ... [详细]

蜡笔小新 2024-12-26 13:30:37
go
软件工程个人学习报告

本报告涵盖了个人博客账号和码云账号的注册过程，以及对网络工程专业学习的反思与展望。通过回顾初入大学时的专业选择，分析当前的专业知识和技能水平，并对未来的职业规划进行了详细讨论。 ... [详细]

蜡笔小新 2024-12-26 12:59:03
x86
Qt 5.15.2 在银河麒麟龙芯平台打包的实战经验

本文详细记录了在银河麒麟操作系统和龙芯架构上使用 Qt 5.15.2 进行项目打包时遇到的问题及解决方案，特别关注于 linuxdeployqt 工具的应用。 ... [详细]

蜡笔小新 2024-12-26 10:54:04
go
VSCode与Gitee集成：项目提交的高效实践

本文介绍如何利用VSCode内置的Git工具将项目提交到Gitee，简化Git命令的使用，提升代码管理效率。同时分享一些常见的踩坑经验和解决方案。 ... [详细]

蜡笔小新 2024-12-26 10:16:21
go
ECharts线性渐变色应用实例

本文详细介绍了如何在ECharts中使用线性渐变色，通过echarts.graphic.LinearGradient方法实现。文章不仅提供了完整的代码示例，还解释了各个参数的具体含义及其应用场景。 ... [详细]

蜡笔小新 2024-12-26 08:13:53
go
Composer Registry Manager：PHP的源切换管理工具

本文介绍了一个用于Composer的源切换管理工具——Composer Registry Manager。该项目旨在简化Composer包源的管理和切换，避免与常见的CRM系统混淆，并提供了详细的安装和使用指南。 ... [详细]

蜡笔小新 2024-12-25 19:34:14
ci
基于KVM的SRIOV直通配置及性能测试

SRIOV介绍、VF直通配置，以及包转发率性能测试小慢哥的原创文章，欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]

蜡笔小新 2024-12-25 19:26:39
http
Git 分布式版本控制系统：远程仓库的深入探讨

本文详细介绍了Git分布式版本控制系统中远程仓库的概念和操作方法。通过具体案例，帮助读者更好地理解和掌握如何高效管理代码库。 ... [详细]

蜡笔小新 2024-12-25 18:30:21
go
图像标签与以图搜图技术的应用与实践

本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用，涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]

蜡笔小新 2024-12-07 14:28:06
go
APISpace 推出便捷接入的 ChatGPT 服务

随着 ChatGPT 在全球范围内的火热，众多开发者希望利用这一先进技术。然而，由于 OpenAI 官方网站注册流程复杂及支付条件限制，使得国内开发者难以便捷地接入这项技术。为了解决这个问题，APISpace 提供了一种简便的方式，让国内开发者可以轻松体验并使用 ChatGPT。 ... [详细]

蜡笔小新 2024-12-06 19:33:51

不想与你见面_637

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章