标准的LSTM网络以及公式

作者：风云时尚_榜中榜_434 | 来源：互联网 | 2023-08-06 19:31

LSTM使用一个特殊的存储记忆单元可以改善RNN的梯度消失问题，因此在许多自然语言处理任务中它比RNN有更好的性能。LSTM单元的基本结构如下图所示。它由输入门iti

LSTM使用一个特殊的存储记忆单元可以改善RNN的梯度消失问题&＃xff0c;因此在许多自然语言处理任务中它比RNN有更好的性能。LSTM单元的基本结构如下图所示。

在这里插入图片描述
它由输入门 $i_{t}$ &＃xff0c;忘记门 $f_{t}$ &＃xff0c;输出门 $o_{t}$ &＃xff0c;以及一个记忆单元 $c_{t}$ 组成。

给定一个文本序列 $x&＃61;{x1,x2,…,xn},xtx&＃61;\left\{x_{1}, x_{2}, \ldots, x_{n}\right\}, x_{t}$ 表示当前时间步 $t$ 的输入&＃xff0c; $h_{t-1}$ 表示上一步LSTM的输出。

LSTM通过门更新记忆单元状态&＃xff0c;添加或删除信息以保留与任务相关的内容。 $i_{t}$ 乘以候选值 $u_{t}$ 决定了添加到记忆单元的新的输入信息。 $f_{t}$ 乘以 $h_{t-1}$ 决定从记忆单元状态中移除的已有信息。输出门 $o_{t}$ 决定从记忆单元状态最终的输出信息。

输入门:
$it&＃61;σ(W(i)xt&＃43;U(i)ht−1&＃43;b(i))i_{t}&＃61;\sigma\left(W^{(i)} x_{t}&＃43;U^{(i)} h_{t-1}&＃43;b^{(i)}\right)$
忘记门:
$ft&＃61;σ(W(f)xt&＃43;U(f)ht−1&＃43;b(f))f_{t}&＃61;\sigma\left(W^{(f)} x_{t}&＃43;U^{(f)} h_{t-1}&＃43;b^{(f)}\right)$
输出门:
$ot&＃61;σ(W(o)xt&＃43;U(o)ht−1&＃43;b(o))o_{t}&＃61;\sigma\left(W^{(o)} x_{t}&＃43;U^{(o)} h_{t-1}&＃43;b^{(o)}\right)$

记忆单元候选值&＃xff1a;
$ut&＃61;tanh⁡(W(u)xt&＃43;U(u)ht−1&＃43;b(u))u_{t}&＃61;\tanh \left(W^{(u)} x_{t}&＃43;U^{(u)} h_{t-1}&＃43;b^{(u)}\right)$
记忆单元状态更新:
$ct&＃61;it⊙ut&＃43;ft⊙ct−1c_{t}&＃61;i_{t} \odot u_{t}&＃43;f_{t} \odot c_{t-1}$
输出:
$ht&＃61;ot⊙tanh⁡(ct)h_{t}&＃61;o_{t} \odot \tanh \left(c_{t}\right)$

自然语言处理

推荐阅读

神经网络
深度学习与神经网络——邱锡鹏

深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络：一种以（人工)）神经元为基本单元的模型深度学习：一类机器学习问题，主要解决贡献度分配问题知识结构：路线图：顶 ... [详细]

蜡笔小新 2023-10-16 05:57:42
自然语言处理
NLP如何进阶？你应该先掌握四大基本任务！

“语言理解是人工智能领域皇冠上的明珠。”——比尔盖茨自然语言处理是一门综合性的学问，它远远不止机器学习算法。相比图像或语音，文本的变化更加复杂ÿ ... [详细]

蜡笔小新 2023-10-16 05:43:05
自然语言处理
百度AI Studio人流密度常规赛火热进行中，快来报名！

早晨七点半。北京初秋的凉风叫醒了住在望京西的你，睁开眼睛，一想到又要为人类的信息化事业贡献满满的正能量，你不禁哼唱起那句“早晨起来 ... [详细]

蜡笔小新 2023-10-12 18:57:29
机器人
武汉市正式发布促进元宇宙创新发展实施方案

武汉市正式发布促进元宇宙创新发展实施方案 ... [详细]

蜡笔小新 2023-10-12 18:25:31
图像识别
【机器学习入门】公开课笔记：笔记简介

机器学习毫无争议的是如今学术界和工业界最热的领域，它涵盖计算机视觉(CV)、自然语言处理(NLP)、深度学习(DL)等多种技术，在图像识别、知识图谱以及最近非常火热的无人驾驶等诸多领 ... [详细]

蜡笔小新 2023-10-12 16:49:44
机器人
顶尖AI技术人才稀缺，在校生还能追上这波浪潮吗？

作为机器学习最重要的一个分支，近年来深度学习(DeepLearning)发展势头迅猛，借助庞大的数据 ... [详细]

蜡笔小新 2023-10-12 16:30:34
自然语言处理
【跨越鸿沟】学术界与工业界的GAP有多大？

来自：美团技术团队2020年7月31日，由中国图象图形学学会主办、视觉大数据专委会承办，北京智源人工智能研究院和美团协办的ECCV2020 ... [详细]

蜡笔小新 2023-10-12 16:28:53
神经网络
深度学习_机器学习 vs 深度学习到底有啥区别，为什么更多人选择机器学习

本文由编程笔记#小编为大家整理，主要介绍了机器学习vs深度学习到底有啥区别，为什么更多人选择机器学习相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-12 14:41:47
机器人
图灵测试是什么？为什么AlphaGo那么牛却过不了？

导读：本文将介绍人工智能的检测手段——图灵测试。作者：杜振东涂铭来源：大数据DT（ID：hzdashuju&# ... [详细]

蜡笔小新 2023-10-12 14:40:31
神经网络
自然语言处理（机器翻译IBM模型系列）

机器翻译方法概述直接转换法基于规则的翻译方法基于中间语言的翻译方法基于语料库的翻译方法－基于事例的翻译方法－统计翻译方法－神经网络机器翻译基于规则的翻译过程分成6个步骤：(a)对源 ... [详细]

蜡笔小新 2023-10-12 14:26:14
自然语言处理
文件服务器配置访问权限配置,文件服务器配置访问权限配置

文件服务器配置访问权限配置内容精选换一换用户需要使用图形化界面管理HDFS中文件时，可以通过Hue完成任务。Hue界面主要用于文件、表等数据的查看与分析， ... [详细]

蜡笔小新 2023-10-12 14:18:47
自然语言处理
IBM竞赛：用Watson开发认知类移动App

世界移动通信大会上，IBM宣布要举办一场开发竞赛，用于推广IBMWatson认知计算平台上的移动客户和业务APP。\u0026#xD;\n比赛的获胜者将 ... [详细]

蜡笔小新 2023-10-12 14:10:20
tensorflow
WSDm问题语义匹配分类算法，Sentence Embedding实现，自然语言处理

优化版后的网络架构图：参考文献：https:arxiv.orgpdf1808.08762.pdf实现代码（自己修改了一部分， ... [详细]

蜡笔小新 2023-10-12 14:02:50
机器人
智子社区顾问白硕：人工智能的诗与远方，一文读懂NLP起源、流派和技术

人工智能的诗与远方在不久的将来遇上能够创造无限可能的区块链是什么样的呢?人工智能与区块链结合的智子社区正在慢慢构筑这个生态,智子社区顾问白硕老师又是怎么样看待的呢?自然语言是人类 ... [详细]

蜡笔小新 2023-10-12 13:22:35
自然语言处理
机器学习(Machine

给大家分享一个最新的20182019校招春招秋招算法机器学习(MachineLearning)深度学习(DeepLearning)自然语言处理(NLP)CC++Python面试笔记 ... [详细]

蜡笔小新 2023-10-12 13:16:51

风云时尚_榜中榜_434

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章