LADA：LocalAdditivityBasedDataAugmentationforSemisupervisedNER理解

作者：G小麥NO1_238 | 来源：互联网 | 2023-09-09 11:19

介绍NER时深度语言理解的第一阶段，然而，目前的NER模型极大地依赖人工标注的数据。在本次工作中，为了脱离对于有标签数据的依赖ÿ

介绍

NER时深度语言理解的第一阶段，然而，目前的NER模型极大地依赖人工标注的数据。在本次工作中，为了脱离对于有标签数据的依赖，我们提出LADA方法用于半监督NER，通过插入相近的句子生成虚拟数据。我们的方法有两种：Intra-LADA 和 Inter-LADA，Intra-LADA 插入同一个句子中的token，Inter-LADA 采样不同的句子插入。通过采样训练数据的线性添加，LADA 生成了大量的有标签数据，提升了实体和文章理解。我们通过设计一个新的一致性的 loss进一步扩展LADA到半监督。实验在两种基准下实施，证明了我们方法的有效性。

传统ner模型从字典到神经网络到迁移学习都是依赖于大量丰富的有标签数据，由于缺少有标签数据，使得这些模型很难应用于新领域。不同的NLP数据增强方法可以分为两类：① 在token层面的对抗性攻击，例如词替换和增加噪音。 ② 在句子层面的解释，例如反向翻译或者子模块优化模型。前者被广泛使用，后者由于很难维持实体token的一致性，很难应用于NER任务。

我们使用了另外一种数据增强方法mixup，原始用于文本分类。但文本分类是单标签任务，与NER不同。我们引入了LADA限制mixup方法中的样本应该相近。Intra-LADA用来自同一句子的token插入每个token的隐藏层表示。Inter-LADA用来自k近邻采样和随机采样的加权组合的其他句子token插入每个token的隐藏层，权重控制了噪声和正则化之间的精妙权衡。

论文中介绍了LADA模型以及其他三种数据增强的方法

1. LADA

在中间模型中混合两个句子的隐藏层参数

此为mixup方法混合标签的方式

loss

采用kl loss

Pmix表示句子采样概率，以下为随机采样（S表示数据集）

LADA带来了更糟糕的结果。假设是因为句子之间相似度太低带来了噪声，给模型学习造成了困难。因此应该限制两个句子相近。

2. Intra-LADA

构造x’的直接方法是使用x中的相同token，但改变顺序。**优点：**一方面，顺利地实现了从句子层级到token层级的转变，有利于NER任务；另一方面，增强了模型的鲁棒性。**缺点：**它克制了生成句子的多样性。

3. Inter-LADA

两种策略的组合（knn和随机采样）：

使用sentence-Bert将句子编码，计算l²距离（由于token层级的距离比句子分类距离要大）。u作为超参数调节。

KNN降低噪声分析：

- 可能与原始句子包含相同实体，但表示的意义又不同。
- 帮助检测不同实体的相同类型。
- 帮助检测同一实体的不同类型。

4. Semi-supervised LADA

使用back-translation生成x&＃39;，语义相同。由此产生两个问题，① token出现的位置不一样 ② token的数量不一样

对于back-translation，一般情况下entity的个数都应该相同，引入一致性loss控制entity每个类型的个数相同

对于x和x&＃39;，首先猜测token labels

在早期（后期没有用）sharpen归一化

计算每个类型的实体数量

维度为C，C表示实体类型的总数，第i个值表示第i个类型的实体的个数。

loss

consistency loss

其中y^k表示由x生成的第k个x&＃39;

lamda控制了有监督和无监督的比例。

推荐阅读

java
视觉图像的生成机制与英文术语解析

近期，Google Brain、牛津大学和清华大学等多家研究机构相继发布了关于多层感知机（MLP）在视觉图像分类中的应用成果。这些研究深入探讨了MLP在视觉任务中的工作机制，并解析了相关技术术语，为理解视觉图像生成提供了新的视角和方法。 ... [详细]

蜡笔小新 2024-10-30 09:47:50
java
深入解析 Kubernetes 亲和性调度机制及其优化策略

在 Kubernetes 中，Pod 的调度通常由集群的自动调度策略决定，这些策略主要关注资源充足性和负载均衡。然而，在某些场景下，用户可能需要更精细地控制 Pod 的调度行为，例如将特定的服务（如 GitLab）部署到特定节点上，以提高性能或满足特定需求。本文深入解析了 Kubernetes 的亲和性调度机制，并探讨了多种优化策略，帮助用户实现更高效、更灵活的资源管理。 ... [详细]

蜡笔小新 2024-11-05 17:27:07
text
2019年斯坦福大学CS224n课程笔记：深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析

本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理（NLP）领域的应用，重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析，深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]

蜡笔小新 2024-10-29 10:37:07
sum
NFT市场热度持续攀升，波卡能否抓住机遇迎来NFT夏季热潮？

NFT市场热度持续攀升，波卡能否抓住机遇迎来NFT夏季热潮？ ... [详细]

蜡笔小新 2024-11-09 21:54:31
config
【源自百度知识】批处理技术详解与应用

本文详细介绍了批处理技术的基本概念及其在实际应用中的重要性。首先，对简单的批处理内部命令进行了概述，重点讲解了Echo命令的功能，包括如何打开或关闭回显功能以及显示消息。如果没有指定任何参数，Echo命令会显示当前的回显设置。此外，文章还探讨了批处理技术在自动化任务执行、系统管理等领域的广泛应用，为读者提供了丰富的实践案例和技术指导。 ... [详细]

蜡笔小新 2024-11-09 10:19:25
text
在Django中提交表单时遇到值错误问题如何解决？

在Django项目中，当用户提交包含多个选择目标的表单时，可能会遇到值错误问题。本文将探讨如何通过优化表单处理逻辑和验证机制来有效解决这一问题，确保表单数据的准确性和完整性。 ... [详细]

蜡笔小新 2024-11-08 10:29:57
text
Cosmos生态系统为何迅速崛起，波卡作为跨链巨头应如何应对挑战？

Cosmos生态系统为何迅速崛起，波卡作为跨链巨头应如何应对挑战？ ... [详细]

蜡笔小新 2024-11-08 09:25:06
sum
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
sum
Spring AOP核心概念与术语详解

面向切面编程（AOP）是Spring框架的两大核心概念之一，另一个核心概念是控制反转（IoC）。AOP通过在应用程序中分离横切关注点，如日志记录、事务管理和安全性，从而提高代码的模块化和可维护性。本文将深入探讨AOP的核心概念和术语，帮助读者更好地理解和应用这一重要技术。 ... [详细]

蜡笔小新 2024-11-05 13:16:58
hash
投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元

投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元 ... [详细]

蜡笔小新 2024-11-05 04:56:42
range
从零开始掌握PyTorch：生成对抗网络GAN进阶指南（第九篇）

本文将深入探讨生成对抗网络（GAN）在计算机视觉领域的应用。作为该领域的经典模型，GAN通过生成器和判别器的对抗训练，能够高效地生成高质量的图像。本文不仅回顾了GAN的基本原理，还将介绍一些最新的进展和技术优化方法，帮助读者全面掌握这一重要工具。 ... [详细]

蜡笔小新 2024-11-02 13:18:42
range
深入解析经典卷积神经网络及其实现代码

深入解析经典卷积神经网络及其实现代码 ... [详细]

蜡笔小新 2024-11-01 11:16:09
range
语义、实例与全景分割的对比分析（Comparative Analysis of Semantic, Instance, and Panoptic Segmentation）

图像分割技术在人工智能领域中扮演着关键角色，其中语义分割、实例分割和全景分割是三种主要的方法。本文对这三种分割技术进行了详细的对比分析，探讨了它们在不同应用场景中的优缺点和适用范围，为研究人员和从业者提供了有价值的参考。 ... [详细]

蜡笔小新 2024-10-29 18:51:14
post
在Matlab中自主构建与仿真神经网络模型 - Building and Simulating Neural Network Models Independently in Matlab

在Matlab中，我尝试构建了一个神经网络模型，用于预测函数 y = x^2。为此，我设计并实现了一个拟合神经网络，并对其进行了详细的仿真和验证。通过调整网络结构和参数，成功实现了对目标函数的准确估计。此外，还对模型的性能进行了全面评估，确保其在不同输入条件下的稳定性和可靠性。 ... [详细]

蜡笔小新 2024-10-27 11:21:21
post
深入解析斯坦福大学机器学习课程第二部分的学习心得与笔记

在本文中，我们将深入探讨斯坦福大学机器学习课程第二部分的核心内容与学习体会。文章不仅涵盖了正则化（Regularization）等关键概念，还结合实际案例分析了这些理论在实践中的应用，帮助读者更好地理解和掌握机器学习的高级技巧。此外，我们还将分享一些学习过程中遇到的挑战及解决方案，为后续学习者提供参考。 ... [详细]

蜡笔小新 2024-10-24 12:45:35

G小麥NO1_238

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章