热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

LSTM(LongShortTermMemory)和LSTM例子理解

WhatisLSTMLSTM(LongShort-TermMemory)是长短期记忆网络,是一种时间递归神经网络,适合于处理

What is LSTM

LSTM(Long Short-Term Memory)是长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。
LSTM 已经在科技领域有了多种应用。基于 LSTM 的系统可以学习翻译语言、控制机器人、图像分析、文档摘要、语音识别图像识别、手写识别、控制聊天机器人、预测疾病、点击率和股票、合成音乐等等任务。

LSTM

这里写图片描述

LSTM是为了解决RNN在长期依赖方面的问题,以解决随着梯度下降产生的梯度消失(返回的数值在经过每一层神经网络的时候,乘以一个小于一的权重值,在一定次数之后,返回的数值消失【返回的数值接近于0】),或者是梯度爆炸(返回的数值在经过每一层神经网络的时候,乘以一个大于一的权重值,在一定次数之后,返回的数值爆炸【返回的数值接近于无穷大】)
LSTM实在传统的RNN的每一层的输入层,神经网络层,输出层上加入一个处理函数:
1.在输入层之后添加一个GET()函数用于判断是否要在只有的神经网络的Train中使用当前时刻的输入信息。
2.在神经网络层上添加一个FORGET()函数用于判断是否需要之前时刻神经网络Train产生的结果,来作为当前时刻的神经网络Train的输入信息。或者将其暂时忘记。
3.在输出层之后添加一个GET()函数用于判断是否要读取当前M中产生的信息。
由于加入了以上三个函数,LSTM能够较好的完成RNN在长期依赖方面的问题。获取更好的Train结果。

LSTM例子——论如何快速通关仙剑奇侠传一

正如我们所知道的经典单机游戏仙剑奇侠传一是一个主线剧情+支线剧情的单机扮演类游戏,我们可以通过不断的与剧情任务(主线剧情或支线剧情)的互动来推动游戏向前发展。

对比于LSTM,RNN就是一般玩家。我们可以这样理解整个从一般的RNN推进的顺序可以看做是仙剑的主线剧情(标准结局,Stand End or Sad End),毫无疑问,如果我们只是和RNN一样玩了个Stand End,是难以让我们满足的。

所以,LSTM就登场啦。在骨灰级玩家LSTM的操作之下,我们学会了开发支线剧情,存档操作等等一系列的操作,就使得我们有了更好的(月如版隐藏结局与灵儿版隐藏结局,Happy End)。
在这里的LSTM开发支线剧情,存档操作等等一系列的操作就是我们上面所讲述输入层GET()函数、神经网络层FORGET()函数、输出层GET()函数的作用。我们可以这样理解这三个函数:
输入层GET()函数就是要不要将分线剧情考虑到主线剧情之中(要不要做支线任务,以重不重要,会对结果产生怎么样影响来决定进行还是忽略)。
神经网络层FORGET()函数(分线剧情是否十分重要,需不需要我们暂时忘记主线剧情)。
输出层GET()函数(这一个分线剧情会对我们产生什么影响,是保留还是消除它的作用)。

这里写图片描述

PS:好吧,我承认我是标题党,我也承认图片不是仙一。


转:https://www.cnblogs.com/daneres/p/8933717.html



推荐阅读
  • 鄂维南:从数学角度,理解机器学习的「黑魔法」,并应用于更广泛的科学问题...
    作者|Hertz来源|科学智能AISI北京时间2022年7月8日晚上22:30,鄂维南院士在2022年的国际数学家大会上作一小时大会报告(plenarytalk)。今 ... [详细]
  • 「爆干7天7夜」入门AI人工智能学习路线一条龙,真的不能再透彻了
    前言应广大粉丝要求,今天迪迦来和大家讲解一下如何去入门人工智能,也算是迪迦对自己学习人工智能这么多年的一个总结吧,本条学习路线并不会那么 ... [详细]
  • ICRA2019最佳论文  Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio
    文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议:ICRA2019标题:《MakingSenseofVision ... [详细]
  • 论文阅读:《Bag of Tricks for LongTailed Visual Recognition with Deep Convolutional Neural Networks》
    基于深度卷积神经网络的长尾视觉识别技巧包摘要近年来,挑战性长尾分布上的视觉识别技术取得了很大的进展,主要基于各种复杂的范式(如元学习)。除了这些复杂 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 这是原文链接:sendingformdata许多情况下,我们使用表单发送数据到服务器。服务器处理数据并返回响应给用户。这看起来很简单,但是 ... [详细]
  • 如何去除Win7快捷方式的箭头
    本文介绍了如何去除Win7快捷方式的箭头的方法,通过生成一个透明的ico图标并将其命名为Empty.ico,将图标复制到windows目录下,并导入注册表,即可去除箭头。这样做可以改善默认快捷方式的外观,提升桌面整洁度。 ... [详细]
  • 目录实现效果:实现环境实现方法一:基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了一些好用的搜索引擎的替代品,包括网盘搜索工具、百度网盘搜索引擎等。同时还介绍了一些笑话大全、GIF笑话图片、动态图等资源的搜索引擎。此外,还推荐了一些迅雷快传搜索和360云盘资源搜索的网盘搜索引擎。 ... [详细]
  • 本文研究了使用条件对抗网络进行图片到图片翻译的方法,并提出了一种通用的解决方案。通过学习输入图像到输出图像的映射和训练相应的损失函数,我们可以解决需要不同损失函数公式的问题。实验证明该方法在合成图片、重构目标和给图片着色等多个问题上都很有效。这项工作的重要发现是不再需要人为构建映射函数和损失函数,同时能够得出合理的结果。本文的研究对于图片处理、计算机图片合成和计算机视觉等领域具有重要意义。 ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • Ubuntu18.04 安装ROS Melodic && Ros2 Dashing
    https:blog.csdn.netqq_44717317articledetails104547474一、Ubuntu18.04的安装ubuntu2go的制作关于Ubuntu2 ... [详细]
author-avatar
愛情伈語gg
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有