antd文本域超长问题_「自然语言处理(NLP)」阿里团队文本匹配模型（含源码）...

作者：mobiledu2502894753 | 来源：互联网 | 2023-09-15 19:35

来源：AINLPer微信公众号编辑:ShuYini校稿:ShuYini时间:2019-8-14引言两篇文章与大家分享，第一篇作者对通用文本匹配模型进行探

来源&＃xff1a;AINLPer微信公众号
编辑: ShuYini
校稿: ShuYini
时间: 2019-8-14

引言

两篇文章与大家分享&＃xff0c;第一篇作者对通用文本匹配模型进行探索&＃xff0c;研究了构建一个快速优良的文本匹配模型所需条件&＃xff0c;在此条件下&＃xff0c;其模型性能与最先进的模型相当&＃xff0c;且参数少速度快&＃xff08;6倍&＃xff09;&＃xff1b;第二篇主要研究了集成语言输入特征对神经网络模型产生的影响&＃xff0c;并且发现输入特性对性能的影响比我们研究的任何体系结构参数都要大。

First Blood

TILE: Simple and Effective Text Matching with Richer Alignment Features.

Contributor : 南京大学&&阿里AI团队

Paper: https://www.aclweb.org/anthology/P19-1465

Code: https://github.com/hitvoice/RE2

文章摘要

文中提出了一种快速、强悍神经网络方法来用于通用文本的匹配。我们研究了构建一个快速且性能良好的文本匹配模型的足够条件&＃xff0c;并建议保持三个用于序列间对齐的关键特性:原始点对齐特性、先前对齐特性和上下文特性&＃xff0c;同时简化所有剩余组件。我们在自然语言推理、意图识别和答案选择等任务中&＃xff0c;对4个研究良好的基准数据集进行了实验。我们的模型性能与最先进的模型相当&＃xff0c;并且使用的参数更少&＃xff0c;除此之外&＃xff0c;在推理速度方面与类似模型的相比&＃xff0c;至少要快6倍。

本文模型算法RE2

下图给出了总体架构的说明&＃xff0c;两个文本序列在预测层前对称处理&＃xff0c;除预测层中参数外的所有参数在两个序列之间共享。

其中&＃xff0c;对齐融合层的输入分为三个部分:原始点态特征(嵌入向量&＃xff0c;用空白矩形表示)、先前对齐特征(剩余向量&＃xff0c;用对角线矩形表示)和上下文特征(编码向量&＃xff0c;用实矩形表示)。右边的架构与左边的架构相同&＃xff0c;所以为了简洁起见省略了它。

Augmented Residual Connections&＃xff08;增强剩余链接&＃xff09;

为了给对齐过程提供更丰富的特性&＃xff0c;RE2采用了增强版的剩余连接来连接连续块。在增强剩余连接的情况下&＃xff0c;对齐和融合层的输入分为三个部分&＃xff0c;即原始的点方向特征(嵌入向量)、先前对齐特征(残差向量)和后编码层上下文特征(编码向量)。这三个部分在文本匹配过程中都起到了互补的作用。

AlignmentLayer&＃xff08;对齐层&＃xff09;

对齐层(如上面架构图所示)将来自两个序列的特性作为输入&＃xff0c;并计算对齐后的表示形式作为输出。

Fusion Layer&＃xff08;融合层&＃xff09;

融合层比较三个透视图中的局部表示和对齐表示&＃xff0c;然后将它们融合在一起。

Prediction Layer&＃xff08;预测层&＃xff09;

预测层以池层中v1和v2两个序列的向量表示作为输入&＃xff0c;预测最终目标。

实验结果

主要用到的测试集

SNLI是一个用于自然语言推理的基准数据集。

Scietail是一个由科学问答构成的分类数据集。

Quora Question Pairs2 是一个用于意图识别的数据集&＃xff0c;有两个类指示一个问题是否是另一个问题的意图。WikiQA是基于维基百科的基于检索的问答数据集。

自然语言推理上结果

意图识别结果

答案选择结果

Double Kill

TILE: Extending Neural Question Answering with Linguistic Input Features

Contributor : 比勒费尔德大学&＃xff08;德国&＃xff09;

Paper: https://www.aclweb.org/anthology/W19-5806

Code: None

文章摘要

在一般领域数据集中&＃xff0c;基于神经网络的问答已经取得了相当大的进展。为了探索有助于问答模型推广潜力的方法&＃xff0c;我们重新实现了最先进的体系结构&＃xff0c;在开放域数据集上执行参数搜索&＃xff0c;并评估了集成语言输入特征&＃xff08;如部分语音标记、句法依赖关系和语义角色&＃xff09;的第一种方法。实验结果表明&＃xff0c;添加这些输入特性对性能的影响比我们研究的任何体系结构参数都要大。这些语言知识层有可能显著提高神经网络QA模型的泛化能力&＃xff0c;从而促进跨域模型转移和领域无关的QA模型的开发。

利用语言输入特性扩展QANet

为了评估神经网络QA模型中语言输入特性对齐产生的影响&＃xff0c;我们利用QANet(作者重新实现)作为测试平台。当尝试将模型调整到其他领域时&＃xff0c;这可能会发生意想不到的结果:虽然获取额外的训练数据代价比较大&＃xff0c;但是这些语言输入特性可以通过提供尺度变换、领域无关的信息源来提高性能。我们使用三种不同的语言特性来扩展每个单词的输入:词性标注、依赖关系标记和语义角色。

PoSTags&＃xff08;词性标注&＃xff09;&＃xff0c;我们假设输入标记的语音部分信息将有助于神经网络通过减少特定问题的答案候选数量&＃xff0c;为了提取所有上下文与问题的PoStag&＃xff0c;我们使用spaCy library数据集中的粗略PoStag。

Dependency Relation Labels&＃xff08;依赖关系&＃xff09;&＃xff0c;我们使用spaCy提取问题和上下文的依赖信息。

Semantic Roles&＃xff08;语义角色&＃xff09;&＃xff0c;语义角色标记&＃xff08;SRL&＃xff09;通过识别事件&＃xff08;谓词&＃xff09;及其参与者&＃xff08;语义角色&＃xff09;来发现句子中浅层的语义结构。我们对Bert模型做了进一步的修改&＃xff0c;其中主要修改的如下&＃xff1a;

QANet语言特征的整合&＃xff0c;在标准的QANet体系结构中&＃xff0c;单词和对应的字符被单独嵌入&＃xff0c;然后连接起来&＃xff0c;以获得每个输入单词的一个表示向量。在Sennrich和Haddow(2016)之后&＃xff0c;我们通过将上面描述的每个语言输入特征映射到它自己的嵌入空间&＃xff0c;然后将它们包含到连接中&＃xff0c;从而丰富了这个过程。下图显示了QANet的输入嵌入层的更新版本&＃xff0c;其中包括语言输入特性。

实验结果

训练参数对实验结果的影响

改变每种类型的输入特征及其组合的嵌入维数的结果

三种语言输入特征相结合的结果

ACED

Attention

更多自然语言处理相关知识&＃xff0c;还请关注AINLPer公众号&＃xff0c;极品干货即刻送达。

推荐阅读

uri
深入解析轻量级数据库 SQL Server Express LocalDB

本文详细介绍了 SQL Server Express LocalDB，这是一种轻量级的本地 T-SQL 数据库解决方案，特别适合开发环境使用。文章还探讨了 LocalDB 与其他轻量级数据库的对比，并提供了安装和连接 LocalDB 的步骤。 ... [详细]

蜡笔小新 2024-11-25 20:36:01
controller
构建高性能Feed流系统的设计指南

随着移动互联网的发展，Feed流系统成为了众多社交应用的核心组成部分。本文将深入探讨如何设计一个高效、稳定的Feed流系统，涵盖从基础架构到高级特性的各个方面。 ... [详细]

蜡笔小新 2024-11-26 12:55:53
stream
网络编程：使用POST方法提交表单数据

本文基于《Core Java Volume 2》的内容，深入探讨了网络编程中通过POST方法提交表单数据的技术细节，包括GET与POST方法的区别、POST提交的具体步骤及常见问题处理。 ... [详细]

蜡笔小新 2024-11-26 10:00:57
controller
优雅地记录API调用时长

本文旨在探讨如何高效且优雅地记录API接口的调用时长，通过实际案例和代码示例，帮助开发者理解并实施这一技术，提高系统的可观测性和调试效率。 ... [详细]

蜡笔小新 2024-11-25 17:56:55
input
cnn多实例attention选择的句子关系分类提取Neural Relation Extraction with Selective Attention over Instances

作者提供代码在https:github.comthunlpOpenNRE网址主要技术：文章主要是通过一对实体和对应的多个包含实体对的句子实例作为训练数据集ÿ ... [详细]

蜡笔小新 2024-11-25 13:23:21
ip
深入解析Nacos服务自动注册机制

本文将探讨Nacos服务自动注册的具体实现方法，特别是如何通过Spring事件机制完成服务注册。通过对Nacos源码的详细分析，帮助读者理解其背后的原理。 ... [详细]

蜡笔小新 2024-11-25 11:00:16
ip
41款高效LISP工具助力数据处理全流程

本文由公众号【数智物语】(ID: decision_engine)发布，关注获取更多干货。文章探讨了从数据收集到清洗、建模及可视化的全过程，介绍了41款实用工具，旨在帮助数据科学家和分析师提升工作效率。 ... [详细]

蜡笔小新 2024-11-24 00:11:50
import
解决jQuery Spinner按钮垂直排列问题

本文探讨了如何通过CSS调整jQuery Spinner组件中的上下按钮，实现它们的垂直堆叠布局。 ... [详细]

蜡笔小新 2024-11-26 11:06:24
ip
从After Effects导入动画相机到Vizrt的方法

本文详细介绍了如何将After Effects中的动画相机数据导入到Vizrt系统中，提供了一种有效的解决方案，适用于需要在广播级图形制作中使用AE动画的专业人士。 ... [详细]

蜡笔小新 2024-11-26 10:47:22
import
Frida环境搭建与基础使用教程

本文详细介绍了如何在本地环境中安装配置Frida及其服务器组件，以及如何通过Frida进行基本的应用程序动态分析，包括获取应用版本和加载的类信息。 ... [详细]

蜡笔小新 2024-11-25 17:43:00
stream
深入解析 cache-content-type 和 mime-types 的应用与优化

本文介绍了两个重要的Node.js库——cache-content-type和mime-types，它们在处理HTTP响应头时非常有用。cache-content-type是基于mime-types构建的，并且实现了缓存机制以提高性能。 ... [详细]

蜡笔小新 2024-11-25 16:51:02
uri
CNN模型压缩——使用网络稀疏化方法（Learning Effcient Convolutional Network through Network Sliming）

文章目录IntroductionRelatedWork网络稀疏化（NetworkSlimming）whychoosechennel-levelspars ... [详细]

蜡笔小新 2024-11-25 12:18:05
js
Java毕业设计：在线办公工作流系统MyBatis+源码+调试部署+数据库+论文

本文介绍了基于Java的在线办公工作流系统的毕业设计方案，涵盖了MyBatis框架的应用、源代码分析、调试与部署流程、数据库设计以及相关论文撰写指导。 ... [详细]

蜡笔小新 2024-11-25 10:21:47
controller
SpringBoot底层注解用法及原理

2.1、组件添加1、Configuration基本使用Full模式与Lite模式示例最佳实战配置类组件之间无依赖关系用Lite模式加速容器启动过程，减少判断配置类组 ... [详细]

蜡笔小新 2024-11-25 09:48:01
ip
深入理解XSS漏洞及其防范措施

本文详细介绍了跨站脚本攻击（XSS）的基本概念、工作原理，并通过实际案例演示如何构建XSS漏洞的测试环境，以及探讨了XSS攻击的不同形式和防御策略。 ... [详细]

蜡笔小新 2024-11-24 21:14:20

mobiledu2502894753

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章