热门标签 | HotTags
当前位置:  开发笔记 > 开发工具 > 正文

LSTMStateTuple与Tensorflow中RNN的cell.zero_state()

如何解决《LSTMStateTuple与Tensorflow中RNN的cell.zero_state()》经验,为你挑选了1个好方法。

我对在Tensorflow中使用RNN的初始状态张量的正确方法感到困惑.在使用LSTMStateTuple或cell.zero_state的turtorial之间几乎有50/50的分割.

这两个是一样的吗?如果是这样,为什么有两种方法呢?

在一个示例中,它们用于tf.nn.rnn_cell.LSTMStateTuple设置初始状态,而在另一个示例中,它们使用cell.zero_state().

为什么有两种方法?何时更喜欢这一个?你可以只LSTMStateTuple在你设置时使用state_is_tuple吗?如果是这样,cell.zero_state()不再有用吗?



1> Mihail Burdu..:

这两者是不同的东西.state_is_tuple用于LSTM细胞,因为LSTM细胞的状态是元组.cell.zero_state是所有RNN小区的状态的初始化器.

您通常会更喜欢cell.zero_state函数,因为它将根据是否state_is_tuple为真来初始化所需的状态类.

请参阅此 GitHub问题,您可以在其中看到cell.zero_state建议的 - "在单元对象上使用zero_state函数".

您可能想要的另一个原因cell.zero_state是因为它不知道单元格的类型(LSTM,GRU,RNN),您可以这样做:

if type == 'GRU':
   cell = BasicGRUCell
else:
   cell = BasicLSTMCell(state_is_tuple=True)

init_state = cell.zero_state(batch_size)

初始状态设置好了.

LSTMStateTuple 将仅适用于具有状态作为元组的单元格.

何时使用LSTMStateTuple?

LSTMStateTuple当您使用自定义值(由培训师传递)初始化您的状态时,您将需要使用.cell.zero_state()将返回所有值等于0.0的状态.

如果您希望在批次之间保持状态,则必须在每批次之后获取它并将其添加到feed_dict下一批次.

见这对于为什么LSTM状态是一个元组的解释.


推荐阅读
  • 在1995年,Simon Plouffe 发现了一种特殊的求和方法来表示某些常数。两年后,Bailey 和 Borwein 在他们的论文中发表了这一发现,这种方法被命名为 Bailey-Borwein-Plouffe (BBP) 公式。该问题要求计算圆周率 π 的第 n 个十六进制数字。 ... [详细]
  • 本文详细介绍了 `org.apache.tinkerpop.gremlin.structure.VertexProperty` 类中的 `key()` 方法,并提供了多个实际应用的代码示例。通过这些示例,读者可以更好地理解该方法在图数据库操作中的具体用途。 ... [详细]
  • Java 中的十进制样式 getZeroDigit()方法,示例 ... [详细]
  • 本文通过C++语言实现了一个递归算法,用于解析并计算数学表达式的值。该算法能够处理加法、减法、乘法和除法操作。 ... [详细]
  • 在开发一个网页音乐播放器时遇到问题,需要从不同源读取MP3文件的ID3标签信息,包括流派、歌手和歌曲名称等。尝试使用PHP未果后转而考虑使用JavaScript进行跨域读取,但不清楚具体配置方法,寻求技术指导。 ... [详细]
  • CRZ.im:一款极简的网址缩短服务及其安装指南
    本文介绍了一款名为CRZ.im的极简网址缩短服务,该服务采用PHP和SQLite开发,体积小巧,约10KB。本文还提供了详细的安装步骤,包括环境配置、域名解析及Nginx伪静态设置。 ... [详细]
  • Requests库的基本使用方法
    本文介绍了Python中Requests库的基础用法,包括如何安装、GET和POST请求的实现、如何处理Cookies和Headers,以及如何解析JSON响应。相比urllib库,Requests库提供了更为简洁高效的接口来处理HTTP请求。 ... [详细]
  • AI炼金术:KNN分类器的构建与应用
    本文介绍了如何使用Python及其相关库(如NumPy、scikit-learn和matplotlib)构建KNN分类器模型。通过详细的数据准备、模型训练及新样本预测的过程,展示KNN算法的实际操作步骤。 ... [详细]
  • 调试利器SSH隧道
    在开发微信公众号或小程序的时候,由于微信平台规则的限制,部分接口需要通过线上域名才能正常访问。但我们一般都会在本地开发,因为这能快速的看到 ... [详细]
  • 本文详细介绍了 Java 中 org.apache.jena.atlas.lib.ByteBufferLib 类下的 acopyArray 方法,并提供了多个实际应用中的代码示例,帮助开发者更好地理解和使用该方法。 ... [详细]
  • 从理想主义者的内心深处萌发的技术信仰,推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]
  • Web动态服务器Python基本实现
    Web动态服务器Python基本实现 ... [详细]
  • 在OpenCV 3.1.0中实现SIFT与SURF特征检测
    本文介绍如何在OpenCV 3.1.0版本中通过Python 2.7环境使用SIFT和SURF算法进行图像特征点检测。由于这些高级功能在OpenCV 3.0.0及更高版本中被移至额外的contrib模块,因此需要特别处理才能正常使用。 ... [详细]
  • 本文详细介绍了如何正确设置Shadowsocks公共代理,包括调整超时设置、检查系统限制、防止滥用及遵守DMCA法规等关键步骤。 ... [详细]
  • 理解浏览器历史记录(2)hashchange、pushState
    阅读目录1.hashchange2.pushState本文也是一篇基础文章。继上文之后,本打算去研究pushState,偶然在一些信息中发现了锚点变 ... [详细]
author-avatar
Angel-約定_335_292_569_759
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有