当前位置: 开发笔记 > 编程语言 > 正文

cnn多实例attention选择的句子关系分类提取NeuralRelationExtractionwithSelectiveAttentionoverInstances

作者：太2真人05 | 来源：互联网 | 2024-11-25 13:23

作者提供代码在https:github.comthunlpOpenNRE网址主要技术：文章主要是通过一对实体和对应的多个包含实体对的句子实例作为训练数据集ÿ

作者提供代码在https://github.com/thunlp/OpenNRE网址

主要技术&＃xff1a;

文章主要是通过一对实体和对应的多个包含实体对的句子实例作为训练数据集&＃xff0c;对训练句子多个实例进行多层卷积然后得到表示编码&＃xff0c;然后通过,对句子进行权重分配&＃xff0c;来表示不同句子对两个实体关系分类的贡献不同。

主要是一些老的方法避免不了错误数据以及噪声的影响&＃xff0c;由此提出的句子级别attention模型来提取关系&＃xff0c;首先我们画出模型整体图进行解析&＃xff1a;

图1

在图中其中表示一对实体的原始句子&＃xff0c;表示句及级别的权重&＃xff0c;也就是对分类的贡献度&＃xff0c;从这里可以看出整个模型思路比较简单。

首先对面为一个句子用cnn编码句子形成语义句子表示&＃xff1b;然后为了能够利用所有的句子集合的信息&＃xff0c;把提取关系表示为句子embedding的组成。通过attention减少错误句子对关系提取的影响&＃xff0c;其中权重是能够训练的。

整个模型共有以下三方面贡献&＃xff1a;

1/与现有方法比较&＃xff0c;利用了所有句及集合信息&＃xff1b;2/为了消除句子噪声影响&＃xff0c;提出句子级别的attention&＃xff1b;3/在实验中发现有助于关系提取的测试&＃xff1b;

模型介绍&＃xff1a;

input&＃xff1a;首先是一个句子集合{x1,x2,...,xn}以及对应的实体对&＃xff0c;

output&＃xff1a;输出每一个已经定义好的关系类别概率R&＃xff1b;

模型组成两个模块&＃xff1a;

&＃xff08;1&＃xff09;句子编码&＃xff1a;给定一个句子x和两个实体对&＃xff0c;用cnn句子的分布表示X&＃xff1b;具体模型结构见图2

&＃xff08;2&＃xff09;经过句子表示分布之后&＃xff0c;通过attention选择哪些对真实关系有作用&＃xff1b;

句子编码&＃xff1a;

图2

如图2我们把句子x转换为表示分布X&＃xff0c;首先转换成真实多特征向量&＃xff0c;然后卷积层&＃xff0c;max-pooling非线性用来构建句子分布表示X&＃xff1b;

具体过程如下&＃xff1a;

&＃xff08;1&＃xff09;输入表示&＃xff1a;输入表示&＃xff0c;我们把句子信息分成两个部分&＃xff0c;一个是实体对应的位置信息编码&＃xff0c;一个是单词编码共同组成句子向量&＃xff1b;

给定一个有m个单词组成句子x&＃xff1b;x&＃61;{w1,w2,...,wm},每一个wi由实值向量表示&＃xff0c;单词表示由embedding矩阵的列向量构成&＃xff1b;即一个列向量表示一个词汇的表示&＃xff0c;那么共有V个词汇假设&＃xff0c;那么v矩阵共有*V个维度。所以矩阵;

位置编码&＃xff1a;越接近目标实体的单词越和关系有关在这样的思想下&＃xff0c;用实体位置关系进行embedding可以有效多帮助cnn追踪每个单词是在实体的前端还是后端。例子&＃xff1a;bill is the founder of microsoft&＃xff0c;founder对应第一个实体的距离是3&＃xff0c;并且对应后一个是2.

在这个例子中假设&＃xff0c;单词的编码维度是3&＃xff0c;位置编码的维度是1&＃xff0c;连接单词编码与位置编码&＃xff0c;和在一起作为句子向量 ,其中之所以乘以2是由于&＃xff0c;每个单词对应两个实体之间的对应关系。

3.12 有关于本论文的卷积以及max-pooling 非线性层

在整个关系提取中,最大的挑战在于句子的长度是可变的,并且重要的信息可以在任何位置,所以需要全局特征,卷积网络能够很好的捕获这些特征,卷积特征首先利用跨度为l的滑动窗口提取局部特征,例如图2,l&＃61;3,然后通过max-pooling获取输入句子的固定特征向量.

因此卷积被定义为句子向量W和一个卷积矩阵,其中就是句子embedding的大小,可以理解为卷积输出的维度大小,定义作为滑动窗口大小的表示,也就是word的联合维度大小..

假设第i个窗口定义如下:

(1)

对于卷积边界直接使用零进行扩充,因此第i个卷积核的表示为:

(2)也容易比较理解,就是把句子局部特征进行提取.

那么作者紧接着在第i步用如下公式进行处理: (3)最后再采用非线性函数进行处理.最终得到句子表示.

3.2 对于多实例选择attention

假设对于一对实体(head,tail) 有句子实例集合S&＃61;,那么每一个,表示一个句子的特征表示,整个实体对的相对于

实体对关系的信息表示为:,整个公式非常明显,就不做多解释.对于权重是怎么计算的,接下来将详细解释.

其中,其中, (8) 是基于查询的函数匹配句子输入是和关系r的得分,我们选择双线性形式,达到最佳表现.其中A是对角矩阵,其中r表示与关系有关系的表示.

最后定义关系分类概率 (9)

其中是关系总共的数量,是神经网络最后的输出,对应所有关系的分数.定义如下:

3.3优化细节

本文模型主要是用了交叉熵函数

推荐阅读

blob
构建基于BERT的中文NL2SQL模型：一个简明的基准

本文探讨了将自然语言转换为SQL语句（NL2SQL）的任务，这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践，该比赛提供了金融和通用领域的表格数据，并标注了对应的自然语言与SQL语句对，旨在训练准确的NL2SQL模型。 ... [详细]

蜡笔小新 2024-12-27 17:36:19
blob
资源推荐 | TensorFlow官方中文教程助力英语非母语者学习

来源：机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南，帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]

蜡笔小新 2024-12-28 09:00:51
string
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
require
XNA 3.0 游戏编程：从 XML 文件加载数据

本文介绍如何在 XNA 3.0 游戏项目中从 XML 文件加载数据。我们将探讨如何将 XML 数据序列化为二进制文件，并通过内容管道加载到游戏中。此外，还会涉及自定义类型读取器和写入器的实现。 ... [详细]

蜡笔小新 2024-12-27 11:39:44
fetch
PHP 编程疑难解析与知识点汇总

本文详细解答了 PHP 编程中的常见问题，并提供了丰富的代码示例和解决方案，帮助开发者更好地理解和应用 PHP 知识。 ... [详细]

蜡笔小新 2024-12-28 12:22:34
string
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
string
Java 中 Writer flush()方法，示例

Java 中 Writer flush()方法，示例 ... [详细]

蜡笔小新 2024-12-28 06:41:52
select
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
select
DNN Community 和 Professional 版本的主要差异

本文详细解析了 DotNetNuke (DNN) 的两种主要版本：Community 和 Professional。通过对比两者的功能和附加组件，帮助用户选择最适合其需求的版本。 ... [详细]

蜡笔小新 2024-12-27 13:14:08
instance
解决Android 8.0上使用ChinaCock打印控件时扫码闪退问题

本文详细探讨了在Android 8.0设备上使用ChinaCock的TCCBarcodeScanner进行扫码时出现的应用闪退问题，并提供了解决方案。通过调整配置文件，可以有效避免这一问题。 ... [详细]

蜡笔小新 2024-12-27 10:10:31
string
解析Java中Text.splitText()方法及其应用场景

本文详细介绍了Java中org.w3c.dom.Text类的splitText()方法，通过多个代码示例展示了其实际应用。该方法用于将文本节点在指定位置拆分为两个节点，并保持在文档树中。 ... [详细]

蜡笔小新 2024-12-26 18:31:42
string
使用 SQLiteJDBC 和 HikariCP 实现 Java 程序连接 SQLite 数据库

本文介绍了如何通过 Maven 依赖引入 SQLiteJDBC 和 HikariCP 包，从而在 Java 应用中高效地连接和操作 SQLite 数据库。文章提供了详细的代码示例，并解释了每个步骤的实现细节。 ... [详细]

蜡笔小新 2024-12-26 17:34:42
string
Java中访问器与修改器的深入解析

本文详细介绍了Java中的访问器（getter）和修改器（setter），探讨了它们在保护数据完整性、增强代码可维护性方面的重要作用。通过具体示例，展示了如何正确使用这些方法来控制类属性的访问和更新。 ... [详细]

蜡笔小新 2024-12-26 17:25:24
select
根据条件动态控制文件选择文本的显示

本文讨论了如何根据特定条件动态显示或隐藏文件上传控件中的默认文本（如“未选择文件”）。通过结合CSS和JavaScript，可以实现更灵活的用户界面。 ... [详细]

蜡笔小新 2024-12-26 15:45:21
string
深入理解Android中的ADB Shell Input命令：模拟滑动、按键和点击事件

在维护公司项目时，发现按下手机的某个物理按键后会激活相应的服务，并在屏幕上模拟点击特定坐标点。本文详细介绍了如何使用ADB Shell Input命令来模拟各种输入事件，包括滑动、按键和点击等。 ... [详细]

蜡笔小新 2024-12-26 13:43:24

太2真人05

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章