当前位置: 开发笔记 > 后端 > 正文

Pytorch教程(2)——DynamicRNN

作者：氤氲微凉521 | 来源：互联网 | 2023-08-25 08:03

RNN基本公式在普通神经网络中引入了隐藏状态httanh(wihxt+bih+whhht−1+bhh)h_ttanh(w_{ih}x_t+b_{ih}+w_{hh}h_{t-1}+

RNN基本公式

在普通神经网络中引入了隐藏状态
ht=tanh(wihxt+bih+whhht−1+bhh)h_t=tanh(w_{ih}x_t+b_{ih}+w_{hh}h_{t-1}+b_{hh})

什么是Dynamic RNN

静态RNN：由于静态RNN需要预先指定seq_len，所以所有数据都必须使用同一个seq_len，即每一个batch的seq_len是一致的

动态RNN：由于利用循环次数实现了seq_len的作用，所以不同的batch可以有不同的seq_len，但是同一个batch内的seq_len还是保持一致的

注：左图和右图等价，但是右图等于把左图展开了，右图即static rnn，左图为更紧凑的dynamic rnn

为什么要用batch呢？

因为batch size可以加速训练

而且可以根据一个batch内的样本来更新参数，防止梯度下降的随机性，易于收敛

但是更大的batch会陷入局部最优值

为什么要用Dynamic RNN

dynamic RNN可以让不同迭代传入的batch可以是长度不同的数据，但同一次迭代一个batch内部的所有数据长度仍然是固定的。例如，第一时刻传入的数据shape=[batch_size, 10]，第二时刻传入的数据shape=[batch_size, 12]，第三时刻传入的数据shape=[batch_size, 8]等等；一般通过为batch内不同长度的sequence进行补零操作至相同长度后，与真实seq_len一同输入模型实现。

如何在pytorch中实现Dynamic RNN

输入数据处理

每次取数据

参考来源：

动态RNN和静态RNN区别
如何理解RNN中的Batch_size?
tensor flow dynamic_rnn 与rnn有啥区别?
[莫烦 PyTorch 系列教程] 5.1 – 为什么 Torch 是动态的
训练神经网络时如何确定batch size？

推荐阅读

分布式
精选10款Python框架助力并行与分布式机器学习

随着神经网络模型的不断深化和复杂化，训练这些模型变得愈发具有挑战性，不仅需要处理大量的权重，还必须克服内存限制等问题。本文将介绍10款优秀的Python框架，帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]

蜡笔小新 2024-11-20 19:44:05
go
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新 2024-11-14 13:06:38
go
Vision Transformer (ViT) 和 DETR 深度解析

本文详细介绍了 Vision Transformer (ViT) 和 DETR 的工作原理，并提供了相关的代码实现和参考资料。通过观看教学视频和阅读博客，对 ViT 的全流程进行了详细的笔记整理，包括代码详解和关键概念的解释。 ... [详细]

蜡笔小新 2024-11-12 20:32:38
go
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
go
从零开始掌握PyTorch：生成对抗网络GAN进阶指南（第九篇）

本文将深入探讨生成对抗网络（GAN）在计算机视觉领域的应用。作为该领域的经典模型，GAN通过生成器和判别器的对抗训练，能够高效地生成高质量的图像。本文不仅回顾了GAN的基本原理，还将介绍一些最新的进展和技术优化方法，帮助读者全面掌握这一重要工具。 ... [详细]

蜡笔小新 2024-11-02 13:18:42
session
Hibernate入门指南：单表数据库操作详解

本文介绍了Hibernate作为全面的ORM框架的基础知识，并详细讲解了在MyEclipse环境中配置Hibernate以及进行基本的数据库单表操作的方法，包括增删改查等常见操作。 ... [详细]

蜡笔小新 2024-11-29 15:55:25
session
PHP 中 Application 对象的使用与管理

本文探讨了如何利用 Application 对象在 PHP 应用程序中共享数据，特别是在多用户环境中保持数据的一致性和安全性。文章还介绍了 Application 对象的基本结构、方法和事件，并提供了实际应用示例。 ... [详细]

蜡笔小新 2024-11-29 15:34:01
session
检查并添加不存在的用户名至数据库

本文探讨了一种有效的方法来检查数据库中是否已存在特定的用户名，如果不存在，则将其添加到数据库中。代码示例展示了如何使用SQL查询和C#编程实现这一功能。 ... [详细]

蜡笔小新 2024-11-29 13:32:45
cache
Java 中SimpleDateFormat 错误用法及改正

Java 中SimpleDateFormat 错误用法及改正 ... [详细]

蜡笔小新 2024-11-29 11:34:40
token
优化Nginx中PHP-FPM模块配置以提升性能

通过调整Nginx与PHP-FPM之间的配置，可以显著提高Web服务器处理PHP请求的速度和效率。本文将详细介绍如何针对不同的应用场景优化PHP-FPM的各项关键参数。 ... [详细]

蜡笔小新 2024-11-29 11:28:39
多线程
深入解析线程池的工作原理与实际应用

本文详细探讨了线程池的核心概念、工作原理及其在实际开发中的应用，包括不同类型的线程池创建方式及其适用场景。 ... [详细]

蜡笔小新 2024-11-29 11:24:16
多线程
射频领域博士学位：信号处理算法在射频技术中的职业前景如何？

射频领域的博士学位在信号处理算法方面具有广阔的职业前景，尤其是在射频技术的应用中。例如，加入华为的射频基站部门，从事数字预失真等关键技术的研发工作。在此过程中，需要注意持续跟踪最新的学术和技术进展，保持对行业动态的敏感性，并不断提升自身的实践能力和创新能力。此外，除了技术层面，还应关注行业的整体发展趋势，以便更好地规划职业生涯。 ... [详细]

蜡笔小新 2024-11-02 18:41:10
多线程
吴恩达深度学习课程笔记：第一部分第三周——浅层神经网络详解

浅层神经网络解析：本文详细探讨了两层神经网络（即一个输入层、一个隐藏层和一个输出层）的结构与工作原理。通过吴恩达教授的课程，读者将深入了解浅层神经网络的基本概念、参数初始化方法以及前向传播和反向传播的具体实现步骤。此外，文章还介绍了如何利用这些基础知识解决实际问题，并提供了丰富的实例和代码示例。 ... [详细]

蜡笔小新 2024-11-02 12:20:03
go
理工科男女不容错过的神奇资源网站

十一长假即将结束，你的假期学习计划进展如何？无论你是在家中、思念家乡，还是身处异国他乡，理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档，能够帮助你在假期中高效学习和提升专业技能。 ... [详细]

蜡笔小新 2024-11-01 11:51:44
go
深入解析经典卷积神经网络及其实现代码

深入解析经典卷积神经网络及其实现代码 ... [详细]

蜡笔小新 2024-11-01 11:16:09

氤氲微凉521

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章