「自然语言处理(NLP)」卡内基梅隆（基于语言知识的循环神经网络（RNN优化））

作者：码农 | 来源：互联网 | 2023-09-17 17:29

来源：AINLPer微信公众号（点击了解一下吧）
编辑: ShuYini
校稿: ShuYini
时间: 2019-12-23

TILE: Linguistic Knowledge as Memory for Recurrent Neural Networks
Contributor : Bhuwan Dhingra ，Zhilin Yang等（卡内基梅隆大学）
Paper: https://arxiv.org/pdf/1703.02620v1.pdf
Code: None

文章摘要

训练递归神经网络来建立长期依赖关系是很困难的。本文将使用外部语言知识作为一个明确的信号来告知模型应该使用哪些记忆。即利用外部知识在任意距离的元素之间增加具有类型化边缘的序列，并将结果图分解为有向无环子图。我们提出了一个在递归神经网络中以显式存储器形式编码这些图的模型，并用它来对文本中的共指关系进行建模。我们将模型应用于多个文本理解任务，并在所有考虑的基准（包括CNN、bAbi和LAMBADA）上获得最新的结果。在bAbi QA任务中，我们的模型解决了20个任务中的15个，每个任务只有1000个训练示例。对学习到的表示的分析证明了我们的模型在文档中编码细粒度实体信息的能力。

本文方法简介

利用未增广序列中固有的顺序将图分解为多个有向无环图(DAGs)，并采用拓扑排序。我们将内存引入非循环图编码RNN (MAGERNN)框架，在只接触每个节点一次的情况下计算这些图的表示。MAGERNN学习沿着每个边缘类型传播的单独表示，这在经验上导致了优越的性能。在一个节点上最多有一个特定类型的单一输入边的情况下，它减少为一个内存扩充的常规RNN，其内存访问由一个符号信号决定。
使用MAGE-RNN为文本理解任务建模共引用关系，其中查询的答案必须从上下文文档中提取。如果文档中的标记引用相同的底层实体，则它们通过一个共同引用关系连接。识别这种关系对于发展对文档的理解是很重要的，因此，我们通过对相关提及的显式记忆来增强文本理解的RNN架构。

具体方法介绍

从序列到多个有向无环图（Sequences to DAGs）

一种edge可能连接同一实体的多次提及(共同引用)，而另一种edge可能连接通用术语到它们的特定实例(下义和上义)。「自然语言处理(NLP)」卡内基梅隆（基于语言知识的循环神经网络（RNN优化））图1显示了一个简单的示例。任何文本片段都可以通过运行标准的预处理工具(如共引用标记器和实体链接器)来以这种方式扩充。对于每一个DAG，其节点在一个序列中都存在一个拓扑排序，使得图中的所有边都从前一个节点指向序列中的下一个节点。对于一个序列 $(1, 2 ， \dots ， T) (1,2，…，T)$ ，那么它的反向序列为 $(T,T−1，…，1)$ 。这种顺序的存在使DAGs特别适合使用RNNs建模，下面我们将讨论这样做的架构。

MAGE-GRUs

在共同引用的情况下，或者在任何节点上最多有一个特定类型的传入边的任何关系中，DAG可以分解为一个独立链的集合。然后，可以将for e in range(2)的更新简单地组合成一个常规的GRU更新，如图2所示。

多序列情况

在某些应用程序中，我们有多个序列，它们的元素通过已知的关系相互作用。如图3，显示了一个示例，其中第一个序列是上下文段落，第二个序列是针对该段落提出的问题。利用共参考和半互序关系进一步扩充序列，得到无向循环图。将此图分解为dag集合，并使用上面提供的MAGE-GRU来学习序列中元素的表示。同时，我们希望在分解后的DAGs中保留原序列的顺序。假设我们有S个序列 $X 1 ， \dots ， X S {X1，…，XS}$ 。一种方法是这样的:对于序列集合的每个排列 $(X_{k1},X_{k2}，…，X_{kS})$ ，将其分解为前向和后向的子图，然而，这样会产生2S! DAGs，这样的计算量代价是很大的。相反，我们在这里建议对序列进行随机排列，并将其分解为正向和反向子图。以这种方式，图中的每条边仍然要遍历两次(两个方向都要遍历一次)，与单独处理序列相比，不会产生任何额外的成本。此外，MAGE-GRU的多层扩展可以允许信息通过图中的任意路径流动。

实验结果

上图4展示我们提出的模型和几个基线模型。对比发现我们的模型取得了最先进的结果，超过了强大的基线，如QRNs。此外，我们还观察到，该方案可以显著地改善 bi-GRUs 和 GAs的性能。添加与one-hot特性相同的信息并不能提高性能，这表明我们在MAGE上使用的归纳偏差是有用的。上图5显示QRNs和 MAGEs的表现。MAGE的两个改进都比目前 bAb i数据集上最先进的QRNs要好得多。
本文使用Stanford CoreNLP tools4为数据集中的每个段落提取了共参考链，并将基线模型的性能与我们提出的MAGE-GRU进行了比较，如下图6所示。

Attention

更多自然语言处理相关知识，还请关注**AINLPer**公众号，***干货即刻送达。

推荐阅读

js
如何高效学习鸿蒙操作系统：开发者指南

本文探讨了开发者如何更有效地学习鸿蒙操作系统，提供了来自行业专家的建议，包括系统化学习方法、职业规划建议以及具体的开发技巧。 ... [详细]

蜡笔小新 2024-11-23 19:22:14
filter
探索CNN的可视化技术

神经网络的可视化在理论学习与实践应用中扮演着至关重要的角色。本文深入探讨了三种有效的CNN（卷积神经网络）可视化方法，旨在帮助读者更好地理解和优化模型。 ... [详细]

蜡笔小新 2024-11-24 11:30:28
post
如何高效解决Android应用ANR问题？

本文介绍了ANR（应用程序无响应）的基本概念、常见原因及其解决方案，并提供了实用的工具和技巧帮助开发者快速定位和解决ANR问题，提高应用的用户体验。 ... [详细]

蜡笔小新 2024-11-19 19:31:48
数组
自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析

目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]

蜡笔小新 2024-11-14 18:21:21
数组
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
数组
深入理解Java字节码：方法调用详解

本文详细介绍了Java字节码中的方法调用机制，通过具体示例解析了字节码如何处理方法调用及其参数传递。文章由Mahmoud Anouti撰写，原文链接：https://dzone.com/articles/introduction-to-java-bytecode ... [详细]

蜡笔小新 2024-11-24 17:28:38
foreach
D17：C#设计模式之十六观察者模式（Observer Pattern）【行为型】

一、引言今天是2017年11月份的最后一天，也就是2017年11月30日，利用今天再写一个模式，争取下个月（也就是12月份& ... [详细]

蜡笔小新 2024-11-22 19:45:55
python
诚邀资深后端开发工程师加盟，共谋家乡发展

一家位于长沙的知名网络安全企业，现面向全国诚聘高级后端开发工程师，特别欢迎具有一线城市经验的技术精英回归故乡，共创辉煌。 ... [详细]

蜡笔小新 2024-11-22 19:22:15
数组
H5技术实现经典游戏《贪吃蛇》

本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术，我们将探讨如何构建这款游戏的两种主要玩法：积分闯关和无尽模式。 ... [详细]

蜡笔小新 2024-11-21 20:16:59
python
2023年，Android开发前景如何？25岁还能转行吗？

近期，关于Android开发行业的讨论在多个平台上热度不减，许多人担忧其未来发展。本文将探讨当前Android开发市场的现状、薪资水平及职业选择建议。 ... [详细]

蜡笔小新 2024-11-21 18:08:07
filter
图像处理学习笔记：噪声分析与去除策略

本文详细探讨了不同类型的图像噪声及其对应的降噪技术，旨在帮助读者理解各种噪声的本质，并掌握有效的降噪方法。文章不仅介绍了高斯噪声、瑞利噪声、伽马噪声、指数噪声、均匀噪声和椒盐噪声等常见噪声类型，还特别讨论了周期噪声的特性及处理技巧。 ... [详细]

蜡笔小新 2024-11-21 12:22:40
email
python发送邮件库_drymail：Python 电子邮件发送库

说明Python教程正在编写中，欢迎大家加微信sinbam提供意见、建议、纠错、催更。drymail是一个邮件发送库，封装了Python的smtplib ... [详细]

蜡笔小新 2024-11-16 09:30:20
command
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新 2024-11-12 16:19:40
command
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
command
AI TIME联合2021世界人工智能大会，共探图神经网络与认知智能前沿话题

AI TIME携手2021世界人工智能大会，共同探讨图神经网络与认知智能的最新进展。自2018年在上海首次举办以来，WAIC已成为全球AI领域的年度盛会，吸引了众多专家学者和行业领袖参与。本次大会将聚焦图神经网络在复杂系统建模、知识图谱构建及认知智能应用等方面的技术突破和未来趋势。 ... [详细]

蜡笔小新 2024-10-29 11:34:09

码农

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章