当前位置: 开发笔记 > 后端 > 正文

一文搞懂RNN（循环神经网络）基础篇

作者：neixi_0592045 | 来源：互联网 | 2023-06-01 15:54

神经网络基础神经网络可以当做是能够拟合任意函数的黑盒子，只要训练数据足够，给定特定的x，就能得到希望的y，结构图如下：将神经网络模型训练好之后，在输入层给定一个x，通过网络之后就能

神经网络基础

神经网络可以当做是能够拟合任意函数的黑盒子，只要训练数据足够，给定特定的x，就能得到希望的y，结构图如下：

一文搞懂RNN（循环神经网络）基础篇

将神经网络模型训练好之后，在输入层给定一个x，通过网络之后就能够在输出层得到特定的y，那么既然有了这么强大的模型，为什么还需要RNN（循环神经网络）呢？

为什么需要RNN（循环神经网络）

他们都只能单独的取处理一个个的输入，前一个输入和后一个输入是完全没有关系的。但是，某些任务需要能够更好的处理序列的信息，即前面的输入和后面的输入是有关系的。

比如，当我们在理解一句话意思时，孤立的理解这句话的每个词是不够的，我们需要处理这些词连接起来的整个序列； 当我们处理视频的时候，我们也不能只单独的去分析每一帧，而要分析这些帧连接起来的整个序列。

以nlp的一个最简单词性标注任务来说，将我吃苹果三个单词标注词性为我/nn 吃/v 苹果/nn。

那么这个任务的输入就是：

我吃苹果（已经分词好的句子）

这个任务的输出是：

我/nn 吃/v 苹果/nn(词性标注好的句子)

对于这个任务来说，我们当然可以直接用普通的神经网络来做，给网络的训练数据格式了就是我-> 我/nn 这样的多个单独的单词->词性标注好的单词。

但是很明显，一个句子中，前一个单词其实对于当前单词的词性预测是有很大影响的，比如预测苹果的时候，由于前面的吃是一个动词，那么很显然苹果作为名词的概率就会远大于动词的概率，因为动词后面接名词很常见，而动词后面接动词很少见。

所以为了解决一些这样类似的问题，能够更好的处理序列的信息，RNN就诞生了。

RNN结构

首先看一个简单的循环神经网络如，它由输入层、一个隐藏层和一个输出层组成：

一文搞懂RNN（循环神经网络）基础篇

不知道初学的同学能够理解这个图吗，反正我刚开始学习的时候是懵逼的，每个结点到底代表的是一个值的输入，还是说一层的向量结点集合，如何隐藏层又可以连接到自己，等等这些疑惑~这个图是一个比较抽象的图。

我们现在这样来理解，如果把上面有W的那个带箭头的圈去掉，它就变成了最普通的全连接神经网络。x是一个向量，它表示输入层的值（这里面没有画出来表示神经元节点的圆圈）；s是一个向量，它表示隐藏层的值（这里隐藏层面画了一个节点，你也可以想象这一层其实是多个节点，节点数与向量s的维度相同）；

U是输入层到隐藏层的权重矩阵，o也是一个向量，它表示输出层的值；V是隐藏层到输出层的权重矩阵。

那么，现在我们来看看W是什么。循环神经网络的隐藏层的值s不仅仅取决于当前这次的输入x，还取决于上一次隐藏层的值s。权重矩阵 W就是隐藏层上一次的值作为这一次的输入的权重。

我们给出这个抽象图对应的具体图：

一文搞懂RNN（循环神经网络）基础篇

我们从上图就能够很清楚的看到，上一时刻的隐藏层是如何影响当前时刻的隐藏层的。

如果我们把上面的图展开，循环神经网络也可以画成下面这个样子：

一文搞懂RNN（循环神经网络）基础篇

RNN时间线展开图

现在看上去就比较清楚了，这个网络在t时刻接收到输入一文搞懂RNN（循环神经网络）基础篇之后，隐藏层的值是，输出值是。关键一点是，的值不仅仅取决于，还取决于。我们可以用下面的公式来表示循环神经网络的计算方法：

用公式表示如下：

一文搞懂RNN（循环神经网络）基础篇

RNN公式

总结

好了，到这里大概讲解了RNN最基本的几个知识点，能够帮助大家直观的感受RNN和了解为什么需要RNN，后续总结它的反向求导知识点。

最后给出RNN的总括图：

一文搞懂RNN（循环神经网络）基础篇

注意：为了简单说明问题，偏置都没有包含在公式里面

推荐阅读

nlp
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
nlp
深入理解卷积神经网络(CNNs)及其应用

回顾与学习是进步的阶梯。再次审视卷积神经网络(CNNs)，我对之前不甚明了的概念有了更深的理解。本文旨在分享这些新的见解，并探讨CNNs在图像识别和自然语言处理等领域中的实际应用。 ... [详细]

蜡笔小新 2024-12-11 13:41:49
nlp
图像标签与以图搜图技术的应用与实践

本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用，涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]

蜡笔小新 2024-12-07 14:28:06
nlp
cnn多实例attention选择的句子关系分类提取Neural Relation Extraction with Selective Attention over Instances

作者提供代码在https:github.comthunlpOpenNRE网址主要技术：文章主要是通过一对实体和对应的多个包含实体对的句子实例作为训练数据集ÿ ... [详细]

蜡笔小新 2024-11-25 13:23:21
service
Linux下NFS客户端配置详解

NFS（Network File System）即网络文件系统，是一种分布式文件系统协议，主要用于Unix和类Unix系统之间的文件共享。本文详细介绍NFS的配置文件/etc/exports和相关服务配置，帮助读者理解如何在Linux环境中配置NFS客户端。 ... [详细]

蜡笔小新 2024-12-18 18:23:35
sockets
Linux环境下通过PHP SMTP发送邮件的配置指南

本文详细介绍了如何在Linux系统中配置PHP通过SMTP发送邮件，包括防火墙设置、端口检查与释放、IPv6到IPv4的转换、DNS缓存刷新以及PHP相关配置等步骤。 ... [详细]

蜡笔小新 2024-12-08 15:50:20
nlp
京东AI创新之路：周伯文解析京东AI战略的独特之处

2018年4月15日，京东在北京举办了人工智能创新峰会，会上首次公开了京东AI的整体布局和发展方向。此次峰会不仅展示了京东在AI领域的最新成果，还标志着京东AI团队的首次集体亮相。本文将深入探讨京东AI的发展策略及其与BAT等公司的不同之处。 ... [详细]

蜡笔小新 2024-12-06 22:57:11
nlp
python image stiching_Python自然语言处理，词云图生成

自然语言处理本节介绍如何使用Python中的库，生成词云图，涉及自然语言处理的相关问题，自然语言处理是计算机科学领域与人工智能领域中的一个 ... [详细]

蜡笔小新 2024-12-02 18:34:55
asp.net
Windows 多进程通信API总结

在一个大型的应用系统中，往往需要多个进程相互协作，进程间通信(IPC,InterProcessCommunication)就显得比较重要了。在Linux系统中，有很多种IPC机制， ... [详细]

蜡笔小新 2024-11-30 13:13:03
asp.net
代码优化：避免重复和提高可读性

本文讨论了在处理分页数据时常见的低级错误，并提供了优化后的代码示例，以减少重复代码并提高可读性和维护性。 ... [详细]

蜡笔小新 2024-11-28 15:27:32
nlp
MySQL与Nginx服务状态监控脚本优化

本文介绍了一种有效的方法来监控Web服务器（如Nginx）和数据库服务器（如MySQL）的服务状态，通过端口、进程和服务响应等多种方式确保服务的正常运行。 ... [详细]

蜡笔小新 2024-11-28 10:06:53
nlp
使用snownlp进行微博情感分析的学习实践

本文介绍了如何利用snownlp库对微博内容进行情感分析，包括安装、基本使用以及如何自定义训练模型以提高分析准确性。 ... [详细]

蜡笔小新 2024-11-27 15:01:46
nlp
探索语音处理新领域：pzh-speech工具的开发历程

本文由技术爱好者痞子衡撰写，详细介绍了一款名为pzh-speech的语音处理工具的开发背景与核心技术。该工具旨在简化语音处理流程，为开发者提供一个强大的开源解决方案。 ... [详细]

蜡笔小新 2024-11-26 16:27:12
struct
视觉Transformer综述

本文综述了视觉Transformer在计算机视觉领域的应用，从原始Transformer出发，详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构，还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]

蜡笔小新 2024-11-22 19:53:16
nlp
分层学习率衰减在NLP预训练模型中的应用

本文探讨了如何通过分层学习率衰减技术来优化NLP预训练模型的微调过程，特别是针对BERT模型。通过调整不同层的学习率，可以有效提高模型性能。 ... [详细]

蜡笔小新 2024-11-21 09:11:00

neixi_0592045

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章