当前位置: 开发笔记 > 后端 > 正文

【论文泛读84】使用BERT适配器的Lexicon增强中文序列标记

作者：docetaxel | 来源：互联网 | 2023-05-28 17:57

贴一下汇总贴：论文阅读记录论文链接：《LexiconEnhancedChineseSequenceLabellingUsingBERTAdapter》

贴一下汇总贴&＃xff1a;论文阅读记录

论文链接&＃xff1a;《Lexicon Enhanced Chinese Sequence Labelling Using BERT Adapter》

一、摘要

词典信息和经过训练的模型&＃xff08;例如BERT&＃xff09;由于其各自的优势而被组合用于探索中文序列标记任务。但是&＃xff0c;现有方法仅通过浅层和随机初始化的序列层融合词汇特征&＃xff0c;而没有将其集成到BERT的底层。在本文中&＃xff0c;我们提出了用于中文序列标签的Lexicon增强BERT&＃xff08;LEBERT&＃xff09;&＃xff0c;它通过Lexicon适配器层将外部词典知识直接集成到BERT层中。与现有方法相比&＃xff0c;我们的模型有助于在BERT的较低层进行深度词典知识融合。在十个中文数据集上的三个任务的实验&＃xff0c;包括命名实体识别&＃xff0c;分词和词性标注&＃xff0c;表明LEBERT获得了最新的结果。

github

二、结论

在本文中&＃xff0c;我们提出了一种新的方法来集成词典特征和汉语序列标注的关联规则&＃xff0c;该方法使用词典适配器直接在关联规则的变换层之间注入词典信息。与模型级融合方法相比&＃xff0c;LEBERT允许在BERT级深入融合词汇特征和BERT表示。大量实验表明&＃xff0c;该算法在三个中文序列标注任务的十个数据集上取得了良好的性能。

三、模型

现有的汉语序列标注模型

在这里插入图片描述

研究了LEBERT在三个中文序列标签任务上的有效性&＃xff0c;包括中文NER、中文分词和中文词性标注。在10个基准数据集上的实验结果说明了我们模型的有效性&＃xff0c;其中在所有数据集上的每个任务都实现了最先进的性能。

本文的模型&＃xff1a;与BERT相比&＃xff0c;LEBERT有两个主要区别。首先&＃xff0c;假设中文句子被转换成一个字符-单词对序列&＃xff0c;LEBERT将字符和词典特征都作为输入。第二&＃xff0c;一个词典适配器连接在转换器层之间&＃xff0c;允许词典知识有效地集成到BERT中。

在这里插入图片描述
对比模型&＃xff1a;使用了四个对比模型

在三类十个数据集中&＃xff0c;效果取得了明显的提高。

推荐阅读

port
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
正则
探索电路与系统的起源与发展

本文回顾了电路与系统的发展历程，从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明，还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]

蜡笔小新 2024-12-24 13:57:05
正则
阿里Java面试全解析：从技术面到HR面的详细攻略

本文作者分享了在阿里巴巴获得实习offer的经历，包括五轮面试的详细内容和经验总结。其中四轮为技术面试，一轮为HR面试，涵盖了大量的Java技术和项目实践经验。 ... [详细]

蜡笔小新 2024-12-23 11:32:02
port
Mathematica 12.3.1 中英文版正式发布，附新功能介绍

历经三十年的开发，Mathematica 已成为技术计算领域的标杆，为全球的技术创新者、教育工作者、学生及其他用户提供了一个领先的计算平台。最新版本 Mathematica 12.3.1 增加了多项核心语言、数学计算、可视化和图形处理的新功能。 ... [详细]

蜡笔小新 2024-12-22 09:34:59
port
深入解析 Apache Shiro 安全框架架构

本文详细介绍了 Apache Shiro，一个强大且灵活的开源安全框架。Shiro 专注于简化身份验证、授权、会话管理和加密等复杂的安全操作，使开发者能够更轻松地保护应用程序。其核心目标是提供易于使用和理解的API，同时确保高度的安全性和灵活性。 ... [详细]

蜡笔小新 2024-12-25 16:03:57
mysql
网易严选Java开发面试：MySQL索引深度解析

本文详细记录了网易严选Java开发岗位的面试经验，特别针对MySQL索引相关的技术问题进行了深入探讨。通过本文，读者可以了解面试官常问的索引问题及其背后的原理。 ... [详细]

蜡笔小新 2024-12-24 19:50:16
mysql
React 表单验证：构建无第三方库的表单处理机制

本文将深入探讨如何在不依赖第三方库的情况下，使用 React 处理表单输入和验证。我们将介绍一种高效且灵活的方法，涵盖表单提交、输入验证及错误处理等关键功能。 ... [详细]

蜡笔小新 2024-12-24 15:48:48
微服务
FinOps 与 Serverless 的结合：破解云成本难题

本文探讨了如何通过 FinOps 实践优化 Serverless 应用的成本管理，提出了首个 Serverless 函数总成本估计模型，并分享了多种有效的成本优化策略。 ... [详细]

蜡笔小新 2024-12-24 12:44:26
rabbitmq
科研单位信息系统中的DevOps实践与优化

本文探讨了某科研单位通过引入云原生平台实现DevOps开发和运维一体化，显著提升了项目交付效率和产品质量。详细介绍了如何在实际项目中应用DevOps理念，解决了传统开发模式下的诸多痛点。 ... [详细]

蜡笔小新 2024-12-24 11:46:45
token
2018 区块链技术峰会：专家深度解析核心技术与应用前景

2018年3月31日，CSDN、火星财经联合中关村区块链产业联盟等机构举办的2018区块链技术及应用峰会（BTA）核心分会场圆满举行。多位业内顶尖专家深入探讨了区块链的核心技术原理及其在实际业务中的应用。 ... [详细]

蜡笔小新 2024-12-24 10:56:15
lua
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新 2024-12-24 08:48:32
struct
CodeChef 2014 April Challenge - Chef的最终对决：数据结构与整体二分的应用

本题探讨了在大数据结构背景下，如何通过整体二分和CDQ分治等高级算法优化处理复杂的时间序列问题。题目设定包括节点数量、查询次数和权重限制，并详细分析了解决方案中的关键步骤。 ... [详细]

蜡笔小新 2024-12-22 19:34:39
struct
智能车间调度研究进展

本文综述了基于强化学习的智能车间调度策略，探讨了车间调度问题在资源有限条件下的优化方法。通过数学规划、智能算法和强化学习等手段，解决了作业车间、流水车间和加工车间中的静态与动态调度挑战。重点讨论了不同场景下的求解方法及其应用前景。 ... [详细]

蜡笔小新 2024-12-22 19:02:54
正则
机器学习核心概念与技术

本文系统梳理了机器学习的关键知识点，涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容，并深入探讨了各算法的原理和应用场景。 ... [详细]

蜡笔小新 2024-12-22 09:15:30
token
深入解析Java虚拟机（JVM）架构与原理

本文旨在为读者提供对Java虚拟机（JVM）的全面理解，涵盖其主要组成部分、工作原理及其在不同平台上的实现。通过详细探讨JVM的结构和内部机制，帮助开发者更好地掌握Java编程的核心技术。 ... [详细]

蜡笔小新 2024-12-21 23:50:40

docetaxel

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章