当前位置: 开发笔记 > 前端 > 正文

RNNLSTM－GRU

作者：QueenieYam任嘉明 | 来源：互联网 | 2023-06-02 00:15

文章目录前言为什么引入ＲＮＮ？RNN1.RNN网络结构２.RNN的两个主要应用３.RNN的两个主

文章目录

前言
为什么引入&＃xff32;&＃xff2e;&＃xff2e;&＃xff1f;
RNN
- 1.RNN网络结构
- &＃xff12;.RNN的两个主要应用
- &＃xff13;.RNN的两个主要应用对应的不同的Loss
- &＃xff14;.针对Loss进行反向传播
LSTM
总结

前言

为什么引入&＃xff32;&＃xff2e;&＃xff2e;&＃xff1f;

对于传统的神经网络来说&＃xff0c;一般输入是不带有时间序列的&＃xff0c;比如说输入　学生身体的各个指标进行预测是否是是具有生长缓慢或者是快速的问题&＃xff0c;这样的输入一般是固定的序列&＃xff0c;并且之间是没有相互影响的。然而对于具有时间先后顺序的这些问题&＃xff0c;比如说语音识别&＃xff0c;生成语句等问题&＃xff0c;这样的传统的神经网络并不能很好训练。

RNN

1.RNN网络结构

在这里插入图片描述

&＃xff12;.RNN的两个主要应用

一、用于建模表示句子
将句子通过RNN&＃xff0c;在最后一个RNN隐藏层得到该句子的表示&＃xff0c;其实就是类似于平常的得到一个特征向量。这里就是得到这个句子的表示的特征向量。
用途&＃xff1a;得到一个句子的表示&＃xff0c;我们可以后续使用判别器进行判别等。
在这里插入图片描述

二、用于表示句子的上下文
这个不同于上面的&＃xff0c;这里是表示的句子的额外信息&＃xff0c;得到句子的上下文信息。
用途&＃xff1a;RNN表示句子的上下文信息&＃xff0c;接下来可根据上下文使用语言模型预测下一个单词等。
在这里插入图片描述

&＃xff13;.RNN的两个主要应用对应的不同的Loss

对于这两种不同的应用&＃xff0c;一个是在最后的RNN的隐藏层得到句子的表示&＃xff0c;就是句子的特征向量。这个loss只用考虑最后的预测结果和真实的label之间的差距即可。
另一个是得到句子的上下文语义&＃xff0c;在每一个RNN的隐藏层都是有输出的&＃xff0c;这里的输出的loss都是要计算的&＃xff0c;所以total　loss是所有的loss加在一起。

&＃xff14;.针对Loss进行反向传播

在这里插入图片描述
我们以这张图为例&＃xff0c;只考虑　一个无偏差项的RNN&＃xff0c;S&＃xff10;是固定值&＃xff0c;没有激活函数。
前向传播&＃xff1a;

而激活函数的图像是&＃xff1b;

可以看出&＃xff54;&＃xff41;&＃xff4e;&＃xff48;&＃xff07;&＃xff58;都是小于等于&＃xff11;的&＃xff0c;则如果说&＃xff1a;
&＃xff57;取值&＃xff10;&＃xff0d;&＃xff11;之间&＃xff0c;&＃xff54;很大的话&＃xff0c;&＃xff54;&＃xff41;&＃xff4e;&＃xff48;‘都小于等于&＃xff11;&＃xff0c;则连乘多个&＃xff54;&＃xff41;&＃xff4e;&＃xff48;’　&＃xff0a;　W就会越来越小&＃xff0c;在越靠近输入层的权重就会几乎为&＃xff10;&＃xff0c;也急速hi几乎不更新&＃xff0c;这就是梯度消失。
&＃xff57;取值很大&＃xff0c;连乘多个&＃xff54;&＃xff41;&＃xff4e;&＃xff48;’　&＃xff0a;　W就会趋向于无穷大&＃xff0c;梯度过大没导致更新幅度过大&＃xff0c;可能会溢出&＃xff0c;无法收敛&＃xff0c;这就是梯度爆炸。

LSTM

总结

提示&＃xff1a;这里对文章进行总结&＃xff1a;

例如&＃xff1a;以上就是今天要讲的内容&＃xff0c;本文仅仅简单介绍了pandas的使用&＃xff0c;而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

**注释&＃xff1a;**这里的笔记是参考大神&＃xff0c;大神讲解的十分透彻&＃xff0c;自己学习了就想总总结自己以后经常来看&＃xff0c;所以本文章不做任何的是商业用途&＃xff0c;两个大神原文&＃xff1a;
https://zhuanlan.zhihu.com/p/31781223

https://zhuanlan.zhihu.com/p/28687529

推荐阅读

label
深入浅出TensorFlow数据读写机制

本文详细介绍TensorFlow中的数据读写操作，包括TFRecord文件的创建与读取，以及数据集（dataset）的相关概念和使用方法。 ... [详细]

蜡笔小新 2024-12-19 16:23:17
label
资源推荐 | TensorFlow官方中文教程助力英语非母语者学习

来源：机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南，帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]

蜡笔小新 2024-12-28 09:00:51
label
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
label
从零构建递归神经网络：仅用NumPy实现

尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络（RNN）的门槛，但对于初学者来说，理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理（NLP）的RNN模型。 ... [详细]

蜡笔小新 2024-12-26 11:29:15
label
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
label
VSCode 自定义代码片段配置：实现类似IDEA的快捷代码段（如sout或psvm）

本文详细介绍如何在VSCode中配置自定义代码片段，使其具备与IDEA相似的代码生成快捷键功能。通过具体的Java和HTML代码片段示例，展示配置步骤及效果。 ... [详细]

蜡笔小新 2024-12-25 17:10:13
label
使用 Bokeh 在 Python 中绘制菱形标记

本文介绍了如何使用 Python 的 Bokeh 库在图表上绘制菱形标记。Bokeh 是一个强大的交互式数据可视化工具，支持丰富的图形自定义选项。 ... [详细]

蜡笔小新 2024-12-25 15:53:56
label
Unity编辑器插件：NGUI资源引用检测工具

本文介绍了一款基于NGUI的资源引用检测工具，该工具能够帮助开发者快速查找和管理项目中的资源引用。其功能涵盖Atlas/Sprite、字库、UITexture及组件的引用检测，并提供了替换和修复功能。文末提供源码下载链接。 ... [详细]

蜡笔小新 2024-12-24 17:17:06
css
React 表单验证：构建无第三方库的表单处理机制

本文将深入探讨如何在不依赖第三方库的情况下，使用 React 处理表单输入和验证。我们将介绍一种高效且灵活的方法，涵盖表单提交、输入验证及错误处理等关键功能。 ... [详细]

蜡笔小新 2024-12-24 15:48:48
label
利用生成对抗网络生成多标签离散电子健康记录

本文探讨了通过生成对抗网络（GAN）生成合成电子健康记录（EHR）的方法，旨在解决隐私保护问题并促进医学研究。论文地址为：https://arxiv.org/abs/1703.06490v1。该方法通过生成高维离散变量的综合EHR数据，显著提升了医学研究中的数据可用性和安全性。 ... [详细]

蜡笔小新 2024-12-23 17:28:39
css
在Xcode中配置自定义文本样式

本文探讨了如何在iOS开发环境中，特别是在Xcode 6.1中，设置和应用自定义文本样式。我们将详细介绍实现方法，并提供一些实用的技巧。 ... [详细]

蜡笔小新 2024-12-23 14:36:31
label
使用 NumPy 和 Matplotlib 绘制线图

本文介绍如何利用 Python 中的 NumPy 和 Matplotlib 库，从 NumPy 数组中绘制线图。通过具体的代码示例和详细解释，帮助读者理解并掌握这一技能。 ... [详细]

蜡笔小新 2024-12-23 09:40:01
label
社交网络中的级联行为

社交网络中的级联行为 ... [详细]

蜡笔小新 2024-12-22 16:47:55
jq
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
label
HTML 文件上传按钮的样式设计

本文详细介绍了如何使用 HTML 和 CSS 对文件上传按钮进行样式美化，使用户界面更加友好和美观。 ... [详细]

蜡笔小新 2024-12-20 18:30:59

QueenieYam任嘉明

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章