热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

每日学术推荐:异质图神经网络在抽取式文档摘要中的应用研究

在抽取式文档摘要任务中,学习跨句子关系是至关重要的一步。本文探讨了利用异质图神经网络来捕捉句子间复杂关系的有效方法。通过构建包含不同类型节点和边的图结构,模型能够更准确地识别和提取关键信息,从而生成高质量的摘要。实验结果表明,该方法在多个基准数据集上显著优于传统方法。

作为提取性文档摘要中的关键步骤,学习跨句关系已通过多种方法进行了探索。 一种直观的方法是将它们放在基于图的神经网络中,该网络具有更复杂的结构以捕获句子间的关系。 在本文中,我们提出了一种用于提取摘要的基于异构图的神经网络(HETERSUMGRAPH),该网络包含除句子外的不同粒度级别的语义节点。 这些额外的节点充当句子之间的中介,并丰富了跨句关系。 此外,我们的图结构通过引入文档节点,可以灵活地从单文档设置自然扩展到多文档。 据我们所知,我们是第一个将不同类型的节点引入基于图的神经网络中以进行提取文档摘要并进行全面定性分析以研究其好处的公司。


存在问题

为了有效地从文档中提取值得总结的句子,核心步骤是为交叉句子关系建模。当前大多数模型都使用递归神经网络(RNN)捕获跨句关系(Cheng和Lapata,2016; Nallapati等,2017; Zhou等,2018)。但是,基于RNN的模型通常很难捕获句子级的远程依赖,尤其是在长文档或多文档的情况下。一种更直观的方法是使用图结构为句子之间的关系建模。然而,寻找有效的图结构进行汇总是具有挑战性的。已经以各种方式进行了努力。早期的传统工作利用句间余弦相似度来构建连接图,例如LexRank(Erkan和Radev,2004)和TextRank(Mihalcea和Tarau,2004)。最近,一些作品在构建摘要图时考虑了语篇之间的关系,例如具有句子个性化特征的近似语篇图(ADG)(Yasunaga等人,2017)和修辞结构理论(RST)图(Xu等人。 ,2019)。但是,它们通常依赖于外部工具,并且需要考虑错误传播问题。一种更直接的方法是创建一个句子级的全连接图。在某种程度上,可以将最近工作中使用的Transformer编码器(Vaswani等人,2017)(Zhong等人,2019a; Liu和Lapata,2019b)分类为此类,以学习句子之间的成对交互。尽管取得了成功,但如何构建有效的图结构进行汇总仍是一个悬而未决的问题。


方法

在本文中,我们提出了一种用于提取摘要的异构图网络。我们不仅仅在句子级节点上构建图,而是引入更多的语义单元作为图中的其他节点,以丰富句子之间的关系。这些额外的节点充当连接句子的中介。即,每个附加节点都可以看作是包含该附加节点的句子之间的特殊关系。在通过异构图的消息传递过程中,这些其他节点以及句子节点将被迭代更新。

尽管可以使用更高级的功能(例如实体或主题),但为简单起见,我们在本文中将单词用作语义单元。每个句子都与其包含的单词相关。所有句子对和单词对都没有直接边缘。所构造的异构单词句图具有以下优点:(a)考虑到显式重叠的单词信息,不同的句子可以彼此交互。 (b)单词节点还可以聚合句子中的信息并得到更新。与我们的模型不同,现有模型通常将单词作为嵌入层保持不变。 (c)通过多个消息传递过程可以充分利用不同粒度的信息。 (d)我们的异构图网络可扩展为更多类型的节点。例如,我们可以引入文档节点进行多文档摘要。

给定一个曲线图G = fV;例如,其中V代表节点集,E代表节点之间的边,我们的无向异构图可以正式定义为V = Vw [Vs和E = fe11; ··· ng这里,Vw = fw1; ··· wmg表示文档的m个唯一词,Vs = fs1; ··· sng对应于文档中的n个句子。 E是一个实值边缘权重矩阵,eij 6 = 0(i 2 f1;··; mg; j 2 f1;···ng)表示第j个句子包含第i个单词

图1展示了我们模型的概述,该模型主要包括三个部分:用于节点和边的图初始化器,异构图层和句子选择器。初始化程序首先创建节点和边,然后将其编码为文档图。然后,异构图通过图注意力网络(GAT)在单词和句子节点之间迭代传递消息来更新这些节点表示(Velickovic et al。,2017)。最后,提取句子节点的表示以预测摘要的标签。

本文以句子节点和单词节点作为图节点,以他们之间的tf-idf作为边,然后使用GAT进行训练。

作者进一步修改GAT层以注入使用tf-idf的标量边缘权重eij,将其映射到多维嵌入空间。 因此,等于注意力机制修改如下:

分别对词节点和句子节点进行迭代:

我们使用Trigram Blocking进行解码,这是最大边际相关性的简单但功能强大的版本(Carbonell and Goldstein,1998)。 具体来说,我们根据句子的得分对句子进行排名,并丢弃与前代词组重叠的句子。

多文档的总结摘要,只要加入文档节点即可。


总结

问题:在文档摘要提取任务中,传统模型很难建模文档中句子间的关系。

方法:构建包含所有单词的单词节点,和所有句子的句子节点,词在句子中就建立一条边,并以tf-idf作为额外的边权重,同时使用GAT迭代学习单词节点和句子节点的表示,最后使用句子节点进行摘要句预测。

启发:节点和句子构建图,并使用tf-idf等信息,之前gcn做文本分类就有了,这一套方法应该可以迁移到不少任务。


推荐阅读
  • 本文探讨了如何通过优化 DOM 操作来提升 JavaScript 的性能,包括使用 `createElement` 函数、动画元素、理解重绘事件及处理鼠标滚动事件等关键主题。 ... [详细]
  • H5技术实现经典游戏《贪吃蛇》
    本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术,我们将探讨如何构建这款游戏的两种主要玩法:积分闯关和无尽模式。 ... [详细]
  • 本文介绍了SIP(Session Initiation Protocol,会话发起协议)的基本概念、功能、消息格式及其实现机制。SIP是一种在IP网络上用于建立、管理和终止多媒体通信会话的应用层协议。 ... [详细]
  • 计算机学报精选论文概览(2020-2022)
    本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文,旨在为即将投稿的研究者提供参考。 ... [详细]
  • 如何高效解决Android应用ANR问题?
    本文介绍了ANR(应用程序无响应)的基本概念、常见原因及其解决方案,并提供了实用的工具和技巧帮助开发者快速定位和解决ANR问题,提高应用的用户体验。 ... [详细]
  • 本文将深入探讨 Unreal Engine 4 (UE4) 中的距离场技术,包括其原理、实现细节以及在渲染中的应用。距离场技术在现代游戏引擎中用于提高光照和阴影的效果,尤其是在处理复杂几何形状时。文章将结合具体代码示例,帮助读者更好地理解和应用这一技术。 ... [详细]
  • 管理UINavigationController中的手势返回 - Managing Swipe Back Gestures in UINavigationController
    本文介绍了如何在一个简单的闪存卡片应用中实现平滑的手势返回功能,以增强用户体验。 ... [详细]
  • Maven + Spring + MyBatis + MySQL 环境搭建与实例解析
    本文详细介绍如何使用MySQL数据库进行环境搭建,包括创建数据库表并插入示例数据。随后,逐步指导如何配置Maven项目,整合Spring框架与MyBatis,实现高效的数据访问。 ... [详细]
  • 在1995年,Simon Plouffe 发现了一种特殊的求和方法来表示某些常数。两年后,Bailey 和 Borwein 在他们的论文中发表了这一发现,这种方法被命名为 Bailey-Borwein-Plouffe (BBP) 公式。该问题要求计算圆周率 π 的第 n 个十六进制数字。 ... [详细]
  • Irish budget airline Ryanair announced plans to significantly increase its route network from Frankfurt Airport, marking a direct challenge to Lufthansa, Germany's leading carrier. ... [详细]
  • Go从入门到精通系列视频之go编程语言密码学哈希算法(二) ... [详细]
  • 流处理中的计数挑战与解决方案
    本文探讨了在流处理中进行计数的各种技术和挑战,并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性,还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]
  • flea,frame,db,使用,之 ... [详细]
  • 线段树详解与实现
    本文详细介绍了线段树的基本概念及其在编程竞赛中的应用,并提供了一个具体的线段树实现代码示例。 ... [详细]
  • 本文介绍了一种在ZC公司的员工评估系统中,如何根据动态设置的评分指标,在后台查询时动态生成并显示数据表的方法。该方法确保了评分指标与被评人员信息的有效整合。 ... [详细]
author-avatar
手机用户2602921033
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有