热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

每日学术推荐:异质图神经网络在抽取式文档摘要中的应用研究

在抽取式文档摘要任务中,学习跨句子关系是至关重要的一步。本文探讨了利用异质图神经网络来捕捉句子间复杂关系的有效方法。通过构建包含不同类型节点和边的图结构,模型能够更准确地识别和提取关键信息,从而生成高质量的摘要。实验结果表明,该方法在多个基准数据集上显著优于传统方法。

作为提取性文档摘要中的关键步骤,学习跨句关系已通过多种方法进行了探索。 一种直观的方法是将它们放在基于图的神经网络中,该网络具有更复杂的结构以捕获句子间的关系。 在本文中,我们提出了一种用于提取摘要的基于异构图的神经网络(HETERSUMGRAPH),该网络包含除句子外的不同粒度级别的语义节点。 这些额外的节点充当句子之间的中介,并丰富了跨句关系。 此外,我们的图结构通过引入文档节点,可以灵活地从单文档设置自然扩展到多文档。 据我们所知,我们是第一个将不同类型的节点引入基于图的神经网络中以进行提取文档摘要并进行全面定性分析以研究其好处的公司。


存在问题

为了有效地从文档中提取值得总结的句子,核心步骤是为交叉句子关系建模。当前大多数模型都使用递归神经网络(RNN)捕获跨句关系(Cheng和Lapata,2016; Nallapati等,2017; Zhou等,2018)。但是,基于RNN的模型通常很难捕获句子级的远程依赖,尤其是在长文档或多文档的情况下。一种更直观的方法是使用图结构为句子之间的关系建模。然而,寻找有效的图结构进行汇总是具有挑战性的。已经以各种方式进行了努力。早期的传统工作利用句间余弦相似度来构建连接图,例如LexRank(Erkan和Radev,2004)和TextRank(Mihalcea和Tarau,2004)。最近,一些作品在构建摘要图时考虑了语篇之间的关系,例如具有句子个性化特征的近似语篇图(ADG)(Yasunaga等人,2017)和修辞结构理论(RST)图(Xu等人。 ,2019)。但是,它们通常依赖于外部工具,并且需要考虑错误传播问题。一种更直接的方法是创建一个句子级的全连接图。在某种程度上,可以将最近工作中使用的Transformer编码器(Vaswani等人,2017)(Zhong等人,2019a; Liu和Lapata,2019b)分类为此类,以学习句子之间的成对交互。尽管取得了成功,但如何构建有效的图结构进行汇总仍是一个悬而未决的问题。


方法

在本文中,我们提出了一种用于提取摘要的异构图网络。我们不仅仅在句子级节点上构建图,而是引入更多的语义单元作为图中的其他节点,以丰富句子之间的关系。这些额外的节点充当连接句子的中介。即,每个附加节点都可以看作是包含该附加节点的句子之间的特殊关系。在通过异构图的消息传递过程中,这些其他节点以及句子节点将被迭代更新。

尽管可以使用更高级的功能(例如实体或主题),但为简单起见,我们在本文中将单词用作语义单元。每个句子都与其包含的单词相关。所有句子对和单词对都没有直接边缘。所构造的异构单词句图具有以下优点:(a)考虑到显式重叠的单词信息,不同的句子可以彼此交互。 (b)单词节点还可以聚合句子中的信息并得到更新。与我们的模型不同,现有模型通常将单词作为嵌入层保持不变。 (c)通过多个消息传递过程可以充分利用不同粒度的信息。 (d)我们的异构图网络可扩展为更多类型的节点。例如,我们可以引入文档节点进行多文档摘要。

给定一个曲线图G = fV;例如,其中V代表节点集,E代表节点之间的边,我们的无向异构图可以正式定义为V = Vw [Vs和E = fe11; ··· ng这里,Vw = fw1; ··· wmg表示文档的m个唯一词,Vs = fs1; ··· sng对应于文档中的n个句子。 E是一个实值边缘权重矩阵,eij 6 = 0(i 2 f1;··; mg; j 2 f1;···ng)表示第j个句子包含第i个单词

图1展示了我们模型的概述,该模型主要包括三个部分:用于节点和边的图初始化器,异构图层和句子选择器。初始化程序首先创建节点和边,然后将其编码为文档图。然后,异构图通过图注意力网络(GAT)在单词和句子节点之间迭代传递消息来更新这些节点表示(Velickovic et al。,2017)。最后,提取句子节点的表示以预测摘要的标签。

本文以句子节点和单词节点作为图节点,以他们之间的tf-idf作为边,然后使用GAT进行训练。

作者进一步修改GAT层以注入使用tf-idf的标量边缘权重eij,将其映射到多维嵌入空间。 因此,等于注意力机制修改如下:

分别对词节点和句子节点进行迭代:

我们使用Trigram Blocking进行解码,这是最大边际相关性的简单但功能强大的版本(Carbonell and Goldstein,1998)。 具体来说,我们根据句子的得分对句子进行排名,并丢弃与前代词组重叠的句子。

多文档的总结摘要,只要加入文档节点即可。


总结

问题:在文档摘要提取任务中,传统模型很难建模文档中句子间的关系。

方法:构建包含所有单词的单词节点,和所有句子的句子节点,词在句子中就建立一条边,并以tf-idf作为额外的边权重,同时使用GAT迭代学习单词节点和句子节点的表示,最后使用句子节点进行摘要句预测。

启发:节点和句子构建图,并使用tf-idf等信息,之前gcn做文本分类就有了,这一套方法应该可以迁移到不少任务。


推荐阅读
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • DNN Community 和 Professional 版本的主要差异
    本文详细解析了 DotNetNuke (DNN) 的两种主要版本:Community 和 Professional。通过对比两者的功能和附加组件,帮助用户选择最适合其需求的版本。 ... [详细]
  • Python自动化处理:从Word文档提取内容并生成带水印的PDF
    本文介绍如何利用Python实现从特定网站下载Word文档,去除水印并添加自定义水印,最终将文档转换为PDF格式。该方法适用于批量处理和自动化需求。 ... [详细]
  • 本文探讨了如何在编程中正确处理包含空数组的 JSON 对象,提供了详细的代码示例和解决方案。 ... [详细]
  • 深入解析Android自定义View面试题
    本文探讨了Android Launcher开发中自定义View的重要性,并通过一道经典的面试题,帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识,还提供了实际操作建议。 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 资源推荐 | TensorFlow官方中文教程助力英语非母语者学习
    来源:机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南,帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 数据管理权威指南:《DAMA-DMBOK2 数据管理知识体系》
    本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释,构建了数据管理的总体框架,为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]
  • 本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法,并提供了多个实际代码示例,帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目,具有很高的参考价值。 ... [详细]
  • 本文详细介绍了如何构建一个高效的UI管理系统,集中处理UI页面的打开、关闭、层级管理和页面跳转等问题。通过UIManager统一管理外部切换逻辑,实现功能逻辑分散化和代码复用,支持多人协作开发。 ... [详细]
  • 尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络(RNN)的门槛,但对于初学者来说,理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理(NLP)的RNN模型。 ... [详细]
  • 本文探讨了《魔兽世界》中红蓝两方阵营在备战阶段的策略与实现方法,通过代码展示了双方如何根据资源和兵种特性进行战士生产。 ... [详细]
author-avatar
手机用户2602921033
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有