【论文泛读20】基于迁移学习的日语情感分析研究

作者：文巧语 | 来源：互联网 | 2023-08-25 18:23

贴一下汇总贴：论文阅读记录论文链接：《AnInvestigationofTransferLearning-BasedSentimentAnalysis

贴一下汇总贴&＃xff1a;论文阅读记录

论文链接&＃xff1a;《An Investigation of Transfer Learning-Based Sentiment Analysis in Japanese》

一、摘要

文本分类方法通常需要特定任务的模型体系结构和巨大的标记数据集。最近&＃xff0c;由于基于文本的迁移学习技术的兴起&＃xff0c;我们可以在无监督的情况下预先训练语言模型&＃xff0c;并利用它们有效地执行下游任务。在这项工作中&＃xff0c;我们关注日语&＃xff0c;并展示了迁移学习技术在文本分类中的潜在应用。具体来说&＃xff0c;我们对乐天产品评论和雅虎电影评论数据集进行了二分类和多分类情感分类。我们表明&＃xff0c;基于迁移学习的方法比使用3倍的数据训练的特定任务模型表现更好。此外&＃xff0c;这些方法对于在维基百科1/30中接受过培训的语言建模也能执行得很好。我们将我们预先训练好的模型和代码作为开放源代码发布。

二、结论

我们的工作表明了使用迁移学习技术处理日语情感分类的可能性。基于我们在Rakuten product review和Yahoo movie review数据集上的实验&＃xff0c;我们为未来的日本研究者在情感分析任务中进行迁移学习得出以下结论&＃xff1a;

当任务是二值分类时&＃xff0c;对BERT域的自适应可能不会产生很好的效果。对于所有其他情况&＃xff0c;域适应的性能和域适应一样好&＃xff0c;甚至更好。
ELMo和ULMFiT即使在使用语言模型的一小部分进行训练时也表现良好。
在目标任务上对ELMo和BCN层进行fune调优可以提高性能。

本文贡献&＃xff1a;

在日本二元和五类数据集上对ELMo、ULMFiT和BERT进行了实验。
我们做了几个消融研究&＃xff0c;有助于理解迁移学习在日语情感分析中的有效性。
我们发布了我们预先训练好的模型和代码

三、神经嵌入与分类模型

词嵌入
词嵌入被定义为一个词作为一个密集向量的表示。有许多神经网络实现&＃xff0c;包括word2vec 和Glove &＃xff0c;它们使用单层嵌入&＃xff0c;在各种NLP任务中实现了最先进的性能。然而&＃xff0c;这些嵌入并不是上下文特定的:在短语“I washed my dish”和“I ate my dish”中&＃xff0c;“dish”指的是不同的东西&＃xff0c;但仍然由相同的嵌入来表示。
更符合实际的词嵌入
与固定向量嵌入不同&＃xff0c;卷积使用机器翻译模型将每个单词嵌入到句子的上下文中。该模型包括一个双向LSTM编码器和一个单向注意LSTM解码器&＃xff0c;仅编码器用于下游的特定任务模型。然而&＃xff0c;由于平行语料库的可用性&＃xff0c;预先训练受到限制。(例如English-French)
ELMo (Embeddings from Language Model)是嵌入式语言模型的简称&＃xff0c;它以一种无监督的方式利用了大量的单语数据&＃xff0c;从而克服了这一问题。ELMo的核心基础是双向语言模型&＃xff0c;它通过结合正向和逆向语言模型来学习预测目标词在句子中出现的概率。ELMo还要求下游任务使用特定于任务的模型。
Howard和Ruder提出了一种单一模型架构ULMFiT&＃xff0c;它既可以用于培训前的训练&＃xff0c;也可以用于特定任务的微调。他们使用了新的技术&＃xff0c;如判别式微调和倾斜三角形学习率来稳定微调。OpenAI通过引入GPT(一种多层变压器解码器)扩展了这一思想。ELMo使用前向和后向语言模型的浅层连接&＃xff0c;而ULMFiT和OpenAI GPT是单向的。
Devlin等人认为&＃xff0c;这限制了预先训练的表现方式的能力&＃xff0c;因为它不包含双向语境&＃xff0c;这对单词级别的任务(如回答问题)至关重要。他们提出了一个基于变压器编码器的多层模型BERT&＃xff0c;训练了掩码语言建模(MLM)和下一句预测(NSP)任务。MLM允许通过随机掩蔽每个句子中15%的单词来预测它们的双向训练&＃xff0c;而NSP通过预测两个句子的顺序来帮助任务&＃xff0c;如回答问题。
文本分类
针对英语文本分类&＃xff0c;人们发明了很多模型&＃xff0c;包括KimCNN、LSTM、Attention、RCNN等。然而&＃xff0c;日本人并没有得到多少帮助。据我们所知&＃xff0c;目前最先进的日语文本分类方法是使用浅层(上下文无关的)单词嵌入来进行文本分类。Sun等人提出了超级字符方法&＃xff0c;通过将文本投影到图像中&＃xff0c;将句子分类转化为图像分类。
Zhang和LeCun对中/日/韩语(CJK)和英语的不同编码方式进行了广泛的研究&＃xff0c;涵盖了14个数据集和473种不同的编码组合&＃xff0c;包括单热、字符符号、嵌入以及线性、fasttext和CNN模型。
本文研究了基于迁移学习的情感分析方法&＃xff0c;与上面提到的日语情感分析模型类似。

低镜头学习(Low-shot learning)是指用少量的训练数据来喂养模型&＃xff0c;与通常使用大量数据的做法相反。

推荐阅读

text
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14
rsa
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
rsa
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
const
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
const
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
join
统一知识图谱学习和建议：更好地理解用户偏好

本文介绍了一种将知识图谱纳入推荐系统的方法，以提高推荐的准确性和可解释性。与现有方法不同的是，本方法考虑了知识图谱的不完整性，并在知识图谱中传输关系信息，以更好地理解用户的偏好。通过大量实验，验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]

蜡笔小新 2023-12-11 11:11:02
get
Learning to Paint with Model-based Deep Reinforcement Learning

本文介绍了一种基于模型的深度强化学习方法，通过结合神经渲染器，教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等，以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战，包括绘制纹理丰富的图像等。通过对比实验的结果，作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]

蜡笔小新 2023-12-11 10:27:44
const
android listview OnItemClickListener失效原因

最近在做listview时发现OnItemClickListener失效的问题，经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效，还会导致单击后listview每个item的背景改变，使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况，并提供了解决方法。 ... [详细]

蜡笔小新 2023-12-14 14:25:50
jsp
后台获取视图对应的字符串

1.帮助类后台获取视图对应的字符串publicclassViewHelper{将View输出为字符串(注：不会执行对应的ac ... [详细]

蜡笔小新 2023-12-13 18:03:01
java
如何通过全新应用内评价获取更多优质用户反馈？

Google Play推出全新的应用内评价API，帮助开发者获取更多优质用户反馈。用户每天在Google Play上发表数百万条评论，这有助于开发者了解用户喜好和改进需求。开发者可以选择在适当的时间请求用户撰写评论，以获得全面而有用的反馈。全新应用内评价功能让用户无需返回应用详情页面即可发表评论，提升用户体验。 ... [详细]

蜡笔小新 2023-12-13 17:23:03
java
解决VS写C#项目导入MySQL数据源报错“You have a usable connection already”问题的正确方法

本文介绍了在VS写C#项目导入MySQL数据源时出现报错“You have a usable connection already”的问题，并给出了正确的解决方法。详细描述了问题的出现情况和报错信息，并提供了解决该问题的步骤和注意事项。 ... [详细]

蜡笔小新 2023-12-13 16:31:57
header
拥抱Android Design Support Library新变化（导航视图、悬浮ActionBar）

转载请注明明桑AndroidAndroid5.0Loollipop作为Android最重要的版本之一，为我们带来了全新的界面风格和设计语言。看起来很受欢迎࿰ ... [详细]

蜡笔小新 2023-12-13 16:11:00
get
Android 7自学笔记总结、移动架构视频、安卓面试真题、项目实战源码讲义

本文介绍了Android 7的学习笔记总结，包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容，并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同，否则会出现问题。 ... [详细]

蜡笔小新 2023-12-13 10:06:58
get
单点登录原理及实现方案详解

本文详细介绍了单点登录的原理及实现方案，其中包括共享Session的方式，以及基于Redis的Session共享方案。同时，还分享了作者在应用环境中所遇到的问题和经验，希望对读者有所帮助。 ... [详细]

蜡笔小新 2023-12-12 19:23:28
const
Word2vec from scratch (Skip-gram & CBOW)

在自然語言處理領域中，如何透過向量表達一個詞彙，是近幾年非常火熱的議題，在distributedrepresentation(densevector)尚未風行前，大多數的任務都以1-hotencoding作為詞彙的表示，其方法得到了高維度的稀疏向量，雖容易理解、簡單計算，但也帶來許多副作用；直至2013年，ThomasMikolov等人提出了word2vec，word2vec引用了一個概念，作者導 ... [详细]

蜡笔小新 2023-10-17 15:23:05

文巧语

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章