当前位置: 开发笔记 > 编程语言 > 正文

TreeLSTMSentimentClassification

作者：mobiledu2502901927 | 来源：互联网 | 2023-07-15 14:12

实验室周日讨论班讲的是TreeLSTMSentimentClassification，主讲人：王铭涛本人来做一下总结。下面的图片来自于王铭涛的ppt

实验室周日讨论班讲的是TreeLSTM Sentiment Classification&＃xff0c;主讲人&＃xff1a;王铭涛

本人来做一下总结。

下面的图片来自于王铭涛的ppt

导读

我们一步一步来。先说最基础的RNN结构&＃xff1a;

公式为&＃xff1a;

就一个简单的隐层h。

但是RNN的缺点是会有梯度爆炸或者梯度消失问题。这里我就不详细解释了。下面推荐阅读有我之前的RNN&＃xff0c;LSTM详细讲解&＃xff0c;想更深一步了解的可以去看看。

因为这个致命的问题&＃xff0c;有人提出了LSTM网络&＃xff0c;改善了RNN的缺点&＃xff0c;我们来回顾下&＃xff1a;

重新添加了输入门i&＃xff0c;输出门o&＃xff0c;遗忘门f和记忆单元C&＃xff0c;外加之前的一个隐层h&＃xff08;此h非RNN的h&＃xff0c;公式可见区别&＃xff0c;但都是隐层&＃xff09;。

这种普通的LSTM都是解决线性问题的。例如常用的应用之句子分类&＃xff1a;

每个词在随着时间序列的增加而不断地依次进入LSTM网络。

这种方法有明显的局限性&＃xff1a;当前词的输入需要依赖前一步词的输入。但是如果我当前词要进行运算&＃xff0c;而此时前一步词还没有进行计算可怎么办&＃xff1f;比如下面的基于依存树的情感分类。

TreeLSTM

比如&＃xff0c;这是一棵依存树的抽象表达&＃xff08;如果暂时不知道依存树的就把这个当成一棵树&＃xff09;&＃xff1a;

空白方框就LSTM的一个单元。文本序列为x1,x2,x4,x5,x6。&＃xff08;x3ppt中少画了&＃xff0c;谅解&＃xff09;

x是输入的序列&＃xff0c;y是每个x输入后经过LSTM一个时间片段的预测输出。我们可以看出(y5你们能看出是哪个)&＃xff0c;y4的产生依靠于x4的输入&＃xff0c;y5的产生依靠于x5的输入&＃xff0c;y6的产生依靠于x6的输入&＃xff1b;y3产生需要依赖于y4&＃xff0c;y5&＃xff0c;y6的输入&＃xff0c;y2的产生依靠于x2的输入&＃xff1b;y1的产生依靠于y2,x1,y3的输入。这个显然就不能用到普通LSTM了。这时候TreeLSTM就登场上了历史舞台&＃xff0c;开始绽放放光彩&＃xff01;

既然TreeLSTM和普通LSTM不一样了&＃xff0c;那么咱们怎么计算他们呢&＃xff1f;

虽说不一样&＃xff0c;其实也是有相同的地方。比如普通LSTM当前时间段需要的输入是在执行在本时间段以前就产生了。这样就能一个接一个的运行下去。

TreeLSTM也一样&＃xff0c;我们看图&＃xff1a;

我们先找y2,y4,y5,y6的产生依赖于的x2,x4,x5,x6都已经存在&＃xff0c;那么我们就能通过x2,x4,x5,x6分别过自己的隐层&＃xff0c;得到对应的y2,y4,y5,y6&＃xff1b;类似的&＃xff0c;y2,y3也能相继产生&＃xff1b;接着最终的y1也产生了。

计算逻辑

那这样的到底怎么个呢&＃xff1f;暂时我知道的有两种方法

前提&＃xff1a;

如果当前节点的孩子节点有了值&＃xff08;就是有了y&＃xff09;&＃xff0c;那么我们就将该孩子节点与当前节点的度去掉。

方法一&＃xff1a;

当前节点入度为0的时候&＃xff0c;也就是计算它的所有准备条件都有了的时候&＃xff0c;就能对它进行计算了。

所以&＃xff0c;这个方法总结就是入度为0的节点都可以计算&＃xff0c;然后更新每个节点的入度&＃xff0c;再重复该操作。

方法二&＃xff1a;

层次遍历。最下面的从最下面的开始计算&＃xff0c;最下面的肯定是可以直接计算的。然后刷新&＃xff0c;再计算。

这两种方法在自己以后优化batch的时候很有用的。

具体TreeLSTM计算分析

我们找具体找一个分析&＃xff1a;

y1的产生依靠于y2,x1,y3的输入。那具体怎么计算的呢&＃xff1f;

这里有张计算图&＃xff0c;请看&＃xff1a;

其中h为LSTM的隐层&＃xff0c;c为LSTM的记忆单元。

公式为&＃xff08;在普通LSTM上稍微修改了下&＃xff09;&＃xff1a;

根据公式&＃xff0c;我们来梳理下上面计算图&＃xff1a;

h2,h3求和再与x1进行

得到u1。

c2,f2与c3,f3分别按位相乘再求和&＃xff0c;再加上u1&＃xff0c;i1按位相乘&＃xff0c;最后两个和相加即可&＃xff0c;得到c1。&＃xff08;i1怎么算&＃xff0c;公式里有。&＃xff09;

最后通过该公式

得到隐层h1。

计算loss

每个隐层y都要经过一个线性层&＃xff0c;映射到具体的类别上&＃xff0c;就是每个x对应一个类别&＃xff0c;公式为&＃xff1a;

最终的损失函数为&＃xff1a;

这个损失函数用的是交叉熵&＃xff0c;最后是一个正则化。我之前也讲过&＃xff0c;想了解可以查阅前面的文章。

更多精彩内容&＃xff0c;请关注 深度学习自然语言处理 公众号&＃xff0c;就是下方啦&＃xff01;跟随小博主&＃xff0c;每天进步一丢丢&＃xff01;哈哈&＃xff01;

推荐阅读

int
2019年斯坦福大学CS224n课程笔记：深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析

本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理（NLP）领域的应用，重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析，深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]

蜡笔小新 2024-10-29 10:37:07
int
视觉图像的生成机制与英文术语解析

近期，Google Brain、牛津大学和清华大学等多家研究机构相继发布了关于多层感知机（MLP）在视觉图像分类中的应用成果。这些研究深入探讨了MLP在视觉任务中的工作机制，并解析了相关技术术语，为理解视觉图像生成提供了新的视角和方法。 ... [详细]

蜡笔小新 2024-10-30 09:47:50
int
表面缺陷检测数据集综述及GitHub开源项目推荐

本文综述了表面缺陷检测领域的数据集，并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理，为研究人员提供了全面的资源参考，有助于推动该领域的发展和技术进步。 ... [详细]

蜡笔小新 2024-10-29 08:22:46
int
自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析

目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]

蜡笔小新 2024-11-14 18:21:21
int
非计算机专业的朋友如何拿下多个Offer

大家好，我是归辰。秋招结束后，我已顺利入职，并应公子龙的邀请，分享一些秋招面试的心得体会，希望能帮助到学弟学妹们，让他们在未来的面试中更加顺利。 ... [详细]

蜡笔小新 2024-11-13 18:41:58
int
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
int
优化后的标题：深入探讨网关安全：将微服务升级为OAuth2资源服务器的最佳实践

本文深入探讨了如何将微服务升级为OAuth2资源服务器，以订单服务为例，详细介绍了在POM文件中添加 `spring-cloud-starter-oauth2` 依赖，并配置Spring Security以实现对微服务的保护。通过这一过程，不仅增强了系统的安全性，还提高了资源访问的可控性和灵活性。文章还讨论了最佳实践，包括如何配置OAuth2客户端和资源服务器，以及如何处理常见的安全问题和错误。 ... [详细]

蜡笔小新 2024-11-09 16:13:27
int
清华大学出版社 | 杨丹：基于MATLAB机器视觉的黑色素瘤皮肤癌检测技术及源代码分析（第1689期）

清华大学出版社 | 杨丹：基于MATLAB机器视觉的黑色素瘤皮肤癌检测技术及源代码分析（第1689期） ... [详细]

蜡笔小新 2024-11-07 13:30:09
int
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
int
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
int
如何高效启动大数据应用之旅？

在前一篇文章中，我探讨了大数据的定义及其与数据挖掘的区别。本文将重点介绍如何高效启动大数据应用项目，涵盖关键步骤和最佳实践，帮助读者快速踏上大数据之旅。 ... [详细]

蜡笔小新 2024-11-04 18:30:38
int
基于OpenCV的图像拼接技术实践与示例代码解析

图像拼接技术在全景摄影中具有广泛应用，如手机全景拍摄功能，通过将多张照片根据其关联信息合成为一张完整图像。本文详细探讨了使用Python和OpenCV库实现图像拼接的具体方法，并提供了示例代码解析，帮助读者深入理解该技术的实现过程。 ... [详细]

蜡笔小新 2024-11-03 12:48:59
int
Python与R语言的功能对比及应用场景分析

Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性，但Python作为一种通用编程语言，适用于更广泛的领域，包括Web开发、自动化脚本和机器学习等。对于初学者而言，Python的学习曲线更为平缓，上手更加容易。此外，Python拥有庞大的社区支持和丰富的第三方库，使其在实际应用中更具灵活性和扩展性。 ... [详细]

蜡笔小新 2024-11-01 18:37:10
go
超分辨率技术的全球研究进展与应用现状综述

本文综述了图像超分辨率（Super-Resolution, SR）技术在全球范围内的最新研究进展及其应用现状。超分辨率技术旨在从单幅或多幅低分辨率（Low-Resolution, LR）图像中恢复出高质量的高分辨率（High-Resolution, HR）图像。该技术在遥感、医疗成像、视频处理等多个领域展现出广泛的应用前景。文章详细分析了当前主流的超分辨率算法，包括基于传统方法和深度学习的方法，并探讨了其在实际应用中的优缺点及未来发展方向。 ... [详细]

蜡笔小新 2024-10-31 15:10:48
int
python绘制拟合回归散点图_机器学习之利用Python进行简单线性回归分析

前言：在利用机器学习方法进行数据分析时经常要了解变量的相关性，有时还需要对变量进行回归分析。本文首先对人工智能机器学习深度学习、相关分析因果分析回归分析 ... [详细]

蜡笔小新 2024-10-15 16:59:18

mobiledu2502901927

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章