论文解读：SentiPrompt:SentimentKnowledgeEnhancedPromptTuningforAspectBasedSentimentAnalysis

作者：手机用户2502941531 | 来源：互联网 | 2023-09-25 19:25

论文解读：SentiPrompt:SentimentKnowledgeEnhancedPrompt-TuningforAspect-BasedSentimentAna

论文解读&＃xff1a;SentiPrompt: Sentiment Knowledge Enhanced Prompt-Tuning for Aspect-Based Sentiment Analysis

简要信息&＃xff1a;

序号	属性	值
1	模型名称	SentiPrompt
2	所属领域	自然语言处理&＃xff1b;情感分析
3	研究内容	预训练语言模型&＃xff1b;Prompt框架
4	核心内容	Prompt-based Fine-tuning
5	GitHub源码	https://github.com/MrZixi/SentiPrompt
6	论文PDF	https://arxiv.org/pdf/2109.08306.pdf

核心要点&＃xff1a;

首次将prompt用于方面级情感分析任务&＃xff08;ABSA&＃xff09;&＃xff1b;
提出SentiPrompt-tuning&＃xff0c;给定已知的aspect和opinion&＃xff0c;构建continous template预测对应的sentiment polarity类别&＃xff1b;
使用BART预测aspect和opinion在句子中的索引;

一、任务背景

方面级情感分析&＃xff08;Aspect-based Sentiment Analysis, ABSA&＃xff09;任务是一种较为细粒度的情感分析任务&＃xff0c;其旨在需要抽取aspect、对比polarities以及寻找opinion&＃xff1b;整个任务目的寻找每个成分的情感取向及原因&＃xff0c;并判断整个情感取向。

例如如图所示&＃xff1a;
在这里插入图片描述
给定一个句子&＃xff0c;先前的方法则通过若干sub-task解决ABSA任务&＃xff1a;

Aspect Term Extraction & Sentiment Classification&＃xff1a;抽取相应的aspect&＃xff08;例如owners、beer selection等“主人公”&＃xff09;以及他们的情感取向&＃xff08;分类任务&＃xff0c;例如positive&＃xff09;&＃xff1b;

Aspect Term Extraction and Sentiment Classification (AESC) requires extracting the aspect terms and classifying the sentiment polarities about them

Pair Extraction&＃xff1a;抽取aspect的同时&＃xff0c;抽取相应的观点描述&＃xff08;例如great fun、worth staying for&＃xff09;

Pair Extraction (Pair) extracts the aspect terms as well as the corresponding opinion terms simultaneously

Sentiment Triplet Extraction (Triplet)&＃xff1a;同时抽取aspect、sentiment以及opinion&＃xff0c;例如(owners, great fun, positive)

因此本质上ABSA是一个信息抽取的任务&＃xff0c;即给定一个文本&＃xff0c;其需要抽取的aspect&＃xff08; $a$ &＃xff09;和opinion&＃xff08; $o$ &＃xff09;属于文本中的某个区间span text&＃xff0c;抽取的sentiment polarity&＃xff08; $s$ &＃xff09;则是最终的感情取向&＃xff08;positive、negative和neutral&＃xff09;

二、动机

先前工作解决ABSA的sub-task采用pipeline方法&＃xff0c;非端到端的方法容易造成误差传播问题。后来端到端的神经网络用于解决ABSA任务&＃xff0c;因此可以联合抽取aspect、opinon和polarities。
现如今常用预训练语言模型&＃xff0c;但其pre-training的目标与fine-tuning存在差异&＃xff0c;限制了先验知识的利用潜能&＃xff1b;
Prompt-tuning提出很好的解决了pre-training和fine-tuning之间的gap&＃xff0c;其根据设计的prompt实现下游任务的预测。目前人工构建的prompt成本较高&＃xff1b;

三、方法

3.1 任务描述

给定一个文本 $X&＃61;[x1,x2,⋯,xn]X&＃61;[x_1, x_2, \cdots, x_n]$ &＃xff0c;三个sub-task的输出分别表示为&＃xff1a;
在这里插入图片描述
本文提出模型如下图&＃xff1a;

其主要包括两个部分&＃xff1a;

SentiPrompt tuning&＃xff1a;在给定输入句子以及aspect以及opinion的前提下&＃xff0c;设计continuous template实现对sentiment polarity的分类预测&＃xff1b;
Generation&＃xff1a;用来生成aspect和opinion的在句子中的索引&＃xff1b;

3.2 SentiPrompt Tuning

Sentiment Knowledge Enhanced Prompt Construction

给定一个文本“Good Sushi High Price”&＃xff0c;采用continous方法构建template $T$ &＃xff0c;其包含pseudo token $P_k$ &＃xff08;什么是pseudo token&＃xff1f;可参考P-tuning&＃xff09;以及随机挑选的groud truth aspect&＃xff08;记作 $A$ &＃xff0c;例如Sushi、Price&＃xff09;和opinion&＃xff08;记作 $O$ &＃xff0c;例如Good、High&＃xff09;&＃xff1a;
在这里插入图片描述
当已知aspect以及opinon组成的pair时&＃xff08;例如已知一个groud truth&＃xff08;Sushi&＃xff0c;Good&＃xff09;&＃xff09;&＃xff0c;则直接在上面构建的template后缀添加额外的template&＃xff0c;表示预测这个pair的sentiment polarity&＃xff1a;
在这里插入图片描述
因此两者结合可以表示为&＃xff1a;

例如template可以设计为&＃xff1a;

第一个[MASK]位置的label word为 {“yes”, “no”}&＃xff0c;第二个[MASK]位置的label word为 {POS, NEG, NEU}。

下图中给出了示例“Good Sushi High Price”对应的template&＃xff1a;
在这里插入图片描述
任务目标则为传统的交叉信息熵&＃xff1a;

Prompt Encoder
该部分直接利用P-tuning&＃xff0c;对所有普通的token以及pseudo token先使用BART的embedding进行初始化&＃xff1a;
在这里插入图片描述
其次将所有pseudo token喂入LSTM和MLP后得到隐状态向量&＃xff1a;

最后将所有pseudo token替换掉原始的BART embedding&＃xff0c;而aspect、opinion 以及[MASK] token保持原来的embedding&＃xff0c;最终得到新的embedding&＃xff1a;

将新的embedding喂入BART模型中&＃xff0c;根据Masked Language Model&＃xff0c;可以预测每个[MASK]位置的词。

3.3 Generation Framework for ABSA

BART模型主要分为Encoder和Decoder。Encoder部分为原始的非自回归Transformer模块&＃xff0c;用于对句子进行表征&＃xff0c;Decoder为自回归模块&＃xff0c;本文扩展BART并应用到ABSA任务熵&＃xff0c;具体设计如下&＃xff1a;
Encoder
Encoder用于表征输入句子&＃xff0c;并获得隐状态向量&＃xff1a;
在这里插入图片描述

Decoder
在第 $t$ 时刻&＃xff0c;输入Encoder的隐状态向量 $H^e$ &＃xff0c;以及前 $t - 1$ 个已经生成的结果&＃xff08;token word&＃xff09;&＃xff0c;输出当前时刻预测的token索引。
因为自回归模型是将上一次的输出作为下一次的输入&＃xff0c;而BART输出的是索引&＃xff0c;输入的是token&＃xff0c;因此需要进行index convert&＃xff1a;
在这里插入图片描述

因为输出的label中&＃xff0c;除了原始句子中的token外&＃xff0c;还有额外的polarity class&＃xff1a;POS、NEG和NEU&＃xff0c;因此如果生成的索引属于原始句子&＃xff0c;则取句子中的token&＃xff0c;否则取polarity class。

因此BART的decoder自回归模型输出可表示为&＃xff1a;
在这里插入图片描述
最后在训练时&＃xff0c;SentPrompt-tuning和Generation两个部分的目标进行加权求和&＃xff1a;

推荐阅读

text
iOS如何实现手势

这篇文章主要为大家展示了“iOS如何实现手势”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“iOS ... [详细]

蜡笔小新 2024-11-23 20:37:40
const
egg实现登录鉴权（七）：权限管理

权限管理包含三部分：访问页面的权限，操作功能的权限和获取数据权限。页面权限：登录用户所属角色的可访问页面的权限功能权限：登录用户所属角色的可访问页面的操作权限数据权限：登录用户所属 ... [详细]

蜡笔小新 2024-11-23 16:30:15
const
Node.js OS 模块中的 arch 方法解析

本文详细介绍了 Node.js 中 OS 模块的 arch 方法，包括其功能、语法、参数以及返回值，并提供了具体的使用示例。 ... [详细]

蜡笔小新 2024-11-23 10:19:37
const
Laya 实战教程：模型与动画的导入技巧

在进行模型和动画的导出过程中，需要注意隐藏不必要的场景元素，并确保所需导出的对象位于顶级节点。此外，在导出设置中正确选择节点配置，并为带有动画的对象添加Animator控制器组件，以确保动画能够正常播放。 ... [详细]

蜡笔小新 2024-11-26 09:09:17
const
尤洋：夸父AI系统——大规模并行训练的深度学习解决方案

自从AlexNet等模型在计算机视觉领域取得突破以来，深度学习技术迅速发展。近年来，随着BERT等大型模型的广泛应用，AI模型的规模持续扩大，对硬件提出了更高的要求。本文介绍了新加坡国立大学尤洋教授团队开发的夸父AI系统，旨在解决大规模模型训练中的并行计算挑战。 ... [详细]

蜡笔小新 2024-11-25 19:02:33
const
Node.js模块化的优势及实践

本文探讨Node.js模块化的重要性和具体实现方式，包括其带来的代码复用性增强、可维护性提升、以及如何有效避免命名冲突等问题。 ... [详细]

蜡笔小新 2024-11-25 16:16:46
install
Vue集成XGPlayer视频插件的详细指南

本文详细介绍了如何在Vue项目中集成和配置XGPlayer视频插件，包括安装步骤、基本配置以及常见问题的解决方法。 ... [详细]

蜡笔小新 2024-11-25 15:09:45
const
使用 Babylon.js 实现地球模型与切片地图交互（第三部分）

本文继续探讨在上一章节中构建的地球模型基础上，如何通过自定义的 `CameraEarthWheelControl` 类来实现更精细的地图缩放控制。我们将深入解析该类的实现细节，并展示其在实际项目中的应用。 ... [详细]

蜡笔小新 2024-11-24 14:39:58
install
Vue CLI 3 项目中使用 Pre-render SPA Plugin 进行预渲染

页面预渲染适用于主要包含静态内容的页面。对于依赖大量API调用的动态页面，建议采用SSR（服务器端渲染），如Nuxt等框架。更多优化策略可参见：https://github.com/HaoChuan9421/vue-cli3-optimization ... [详细]

蜡笔小新 2024-11-23 22:19:17
install
binlog2sql，你该知道的数据恢复工具

binlog2sql，你该知道的数据恢复工具 ... [详细]

蜡笔小新 2024-11-22 18:58:43
copy
Ubuntu 14.04 环境下搭建 Caffe（仅限 CPU）

本文详细介绍了如何在 Ubuntu 14.04 系统上搭建仅使用 CPU 的 Caffe 深度学习框架，包括环境准备、依赖安装及编译过程。 ... [详细]

蜡笔小新 2024-11-22 16:43:30
const
利用Node.js实现PSD文件的高效切图

本文介绍了如何通过Node.js及其psd2json模块，快速实现PSD文件的自动化切图过程，以适应项目中频繁的界面更新需求。此方法不仅提高了工作效率，还简化了从设计稿到实际应用的转换流程。 ... [详细]

蜡笔小新 2024-11-22 13:21:24
install
精选10款Python框架助力并行与分布式机器学习

随着神经网络模型的不断深化和复杂化，训练这些模型变得愈发具有挑战性，不仅需要处理大量的权重，还必须克服内存限制等问题。本文将介绍10款优秀的Python框架，帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]

蜡笔小新 2024-11-20 19:44:05
version
深入体验Python的高级交互式Shell - IPython

IPython 是一个增强型的 Python 交互式 Shell，提供了比标准 Python 控制台更为强大的功能，适用于开发和调试过程。它不仅支持直接执行 Linux 命令，还提供了丰富的特性来提高编程效率。 ... [详细]

蜡笔小新 2024-11-20 19:06:56
copy
Android与JUnit集成测试实践

本文探讨了如何在Android项目中集成JUnit进行单元测试，并详细介绍了修改AndroidManifest.xml文件以支持测试的方法。 ... [详细]

蜡笔小新 2024-11-20 18:30:14

手机用户2502941531

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章