当前位置: 开发笔记 > 编程语言 > 正文

pytorch深度学习实践循环神经网络0113

作者：newbigstart | 来源：互联网 | 2023-09-23 05:55

B站刘二大人：循环神经网络（基础篇）目录1、RNN概念2、numLayers含义3、RNN使用4、利用RNNCell训练hell

B站刘二大人&＃xff1a;循环神经网络&＃xff08;基础篇&＃xff09;

1、RNN概念

2、numLayers含义

3、RNN使用

4、利用RNN Cell训练hello转换到ohlol

5、Embedding编码方式

1、RNN概念
        RNN Cell是线性层。
         隐层是RNN Cell里线性层矩阵w的行数。
         使用RNN Cell:
import torchbatch_size &＃61; 1 # 批处理大小 seq_len &＃61; 3 # 序列长度 input_size &＃61; 4 # 输入维度 hidden_size &＃61; 2 # 隐层维度cell &＃61; torch.nn.RNNCell(input_size&＃61;input_size, hidden_size&＃61;hidden_size) # 初始化# (seq, batch, features) dataset &＃61; torch.randn(seq_len, batch_size, input_size) hidden &＃61; torch.zeros(batch_size, hidden_size)# 这个循环就是处理seq_len长度的数据 for idx, data in enumerate(dataset):print(&＃39;&＃61;&＃39; * 20, idx, &＃39;&＃61;&＃39; * 20)print(&＃39;Input size:&＃39;, data.shape, data)hidden &＃61; cell(data, hidden)print(&＃39;hidden size:&＃39;, hidden.shape, hidden)print(hidden)

2、numLayers含义

3、RNN使用
        input_size和hidden_size: 输入维度和隐层维度
        batch_size: 批处理大小
        seq_len: 序列长度
        num_layers: 隐层数目
        使用RNN&＃xff1a;
import torchbatch_size &＃61; 1 # batch_size: 批处理大小 seq_len &＃61; 3 # seq_len: 序列长度 input_size &＃61; 4 # input_size&＃xff1a;输入维度 hidden_size &＃61; 2 # hidden_size: 隐层维度 num_layers &＃61; 1 # num_layers: 隐层数目cell &＃61; torch.nn.RNN(input_size&＃61;input_size, hidden_size&＃61;hidden_size, num_layers&＃61;num_layers)# (seqLen, batchSize, inputSize) inputs &＃61; torch.randn(seq_len, batch_size, input_size) hidden &＃61; torch.zeros(num_layers, batch_size, hidden_size)out, hidden &＃61; cell(inputs, hidden)print(&＃39;Output size:&＃39;, out.shape) # (seq_len, batch_size, hidden_size) print(&＃39;Output:&＃39;, out) print(&＃39;Hidden size:&＃39;, hidden.shape) # (num_layers, batch_size, hidden_size) print(&＃39;Hidden:&＃39;, hidden)

4、利用RNN Cell训练hello转换到ohlol

代码如下&＃xff1a;
import torch input_size &＃61; 4 hidden_size &＃61; 4 batch_size &＃61; 1idx2char &＃61; [&＃39;e&＃39;, &＃39;h&＃39;, &＃39;l&＃39;, &＃39;o&＃39;] x_data &＃61; [1, 0, 2, 3, 3] # hello中各个字符的下标 y_data &＃61; [3, 1, 2, 3, 2] # ohlol中各个字符的下标one_hot_lookup &＃61; [[1, 0, 0, 0],[0, 1, 0, 0],[0, 0, 1, 0],[0, 0, 0, 1]] x_one_hot &＃61; [one_hot_lookup[x] for x in x_data] # (seqLen, inputSize)inputs &＃61; torch.Tensor(x_one_hot).view(-1, batch_size, input_size) labels &＃61; torch.LongTensor(y_data).view(-1, 1) # torch.Tensor默认是torch.FloatTensor是32位浮点类型数据&＃xff0c;torch.LongTensor是64位整型 print(inputs.shape, labels.shape)class Model(torch.nn.Module):def init(self, input_size, hidden_size, batch_size):super(Model, self).init()self.batch_size &＃61; batch_sizeself.input_size &＃61; input_sizeself.hidden_size &＃61; hidden_sizeself.rnncell &＃61; torch.nn.RNNCell(input_size&＃61;self.input_size, hidden_size&＃61;self.hidden_size)def forward(self, inputs, hidden):hidden &＃61; self.rnncell(inputs, hidden) # 输入和隐层转换为下一个隐层# shape of inputs:(batchSize, inputSize),shape of hidden:(batchSize, hiddenSize),return hiddendef init_hidden(self):return torch.zeros(self.batch_size, self.hidden_size) # 生成全0的h0net &＃61; Model(input_size, hidden_size, batch_size)criterion &＃61; torch.nn.CrossEntropyLoss() optimizer &＃61; torch.optim.Adam(net.parameters(), lr&＃61;0.1)for epoch in range(15):loss &＃61; 0optimizer.zero_grad()hidden &＃61; net.init_hidden()print(&＃39;Predicted string:&＃39;, end&＃61;&＃39;&＃39;)for input, label in zip(inputs, labels):hidden &＃61; net(input, hidden)# 注意交叉熵在计算loss的时候维度关系&＃xff0c;这里的hidden是([1, 4]), label是 ([1])loss &＃43;&＃61; criterion(hidden, label)_, idx &＃61; hidden.max(dim &＃61; 1)print(idx2char[idx.item()], end&＃61;&＃39;&＃39;)loss.backward()optimizer.step()print(&＃39;, Epoch [%d/15] loss&＃61;%.4f&＃39; % (epoch&＃43;1, loss.item()))
结果&＃xff1a;

5、Embedding编码方式
       独热编码向量维度过高&＃xff1b;
       独热编码向量稀疏&＃xff0c;每个向量是一个为1其余为0&＃xff1b;
       独热编码是硬编码&＃xff0c;编码情况与数据特征无关&＃xff1b;
采用一种低维度的、稠密的、可学习数据的编码方式&＃xff1a;Embedding。
         代码&＃xff1a;
import torchinput_size &＃61; 4 num_class &＃61; 4 hidden_size &＃61; 8 embedding_size &＃61; 10 batch_size &＃61; 1 num_layers &＃61; 2 seq_len &＃61; 5idx2char_1 &＃61; [&＃39;e&＃39;, &＃39;h&＃39;, &＃39;l&＃39;, &＃39;o&＃39;] idx2char_2 &＃61; [&＃39;h&＃39;, &＃39;l&＃39;, &＃39;o&＃39;]x_data &＃61; [[1, 0, 2, 2, 3]] y_data &＃61; [3, 1, 2, 2, 3]# inputs 维度为&＃xff08;batchsize&＃xff0c;seqLen&＃xff09; inputs &＃61; torch.LongTensor(x_data) # labels 维度为&＃xff08;batchsize*seqLen&＃xff09; labels &＃61; torch.LongTensor(y_data)class Model(torch.nn.Module):def init(self):super(Model, self).init()self.emb &＃61; torch.nn.Embedding(input_size, embedding_size)self.rnn &＃61; torch.nn.RNN(input_size&＃61;embedding_size,hidden_size&＃61;hidden_size,num_layers&＃61;num_layers,batch_first&＃61;True)self.fc &＃61; torch.nn.Linear(hidden_size, num_class)def forward(self, x):hidden &＃61; torch.zeros(num_layers, x.size(0), hidden_size)x &＃61; self.emb(x) # 进行embedding处理x, _ &＃61; self.rnn(x, hidden)x &＃61; self.fc(x)return x.view(-1, num_class)net &＃61; Model()criterion &＃61; torch.nn.CrossEntropyLoss() optimizer &＃61; torch.optim.Adam(net.parameters(), lr&＃61;0.05)for epoch in range(15):optimizer.zero_grad()outputs &＃61; net(inputs)loss &＃61; criterion(outputs, labels)loss.backward()optimizer.step()_, idx &＃61; outputs.max(dim&＃61;1)idx &＃61; idx.data.numpy()print(&＃39;Predicted string: &＃39;, &＃39;&＃39;.join([idx2char_1[x] for x in idx]), end&＃61;&＃39;&＃39;)print(", Epoch [%d/15] loss &＃61; %.3f" % (epoch &＃43; 1, loss.item()))
        结果&＃xff1a;

推荐阅读

string
处理Android EditText中数字输入与parseInt方法

本文探讨了如何在Android应用中从EditText组件安全地获取并解析用户输入的数字，特别是用于设置端口号的情况。通过示例代码和异常处理策略，展示了有效的方法来避免因非法输入导致的应用崩溃。 ... [详细]

蜡笔小新 2024-11-21 20:37:54
string
阶段一：Hankson的趣味数学挑战——不使用辗转相除法求解特定条件下的正整数

Hanks博士是一位著名的生物技术专家，他的儿子Hankson对数学有着浓厚的兴趣。最近，Hankson遇到了一个有趣的数学问题，涉及求解特定条件下的正整数x，而不使用传统的辗转相除法。 ... [详细]

蜡笔小新 2024-11-22 14:26:49
string
UVALive 8201 - BBP 公式计算圆周率

在1995年，Simon Plouffe 发现了一种特殊的求和方法来表示某些常数。两年后，Bailey 和 Borwein 在他们的论文中发表了这一发现，这种方法被命名为 Bailey-Borwein-Plouffe (BBP) 公式。该问题要求计算圆周率 π 的第 n 个十六进制数字。 ... [详细]

蜡笔小新 2024-11-21 18:32:57
string
web: _show -> _info 造轮子编程

问题场景用Java进行web开发过程当中，当遇到很多很多个字段的实体时，最苦恼的莫过于编辑字段的查看和修改界面，发现2个页面存在很多重复信息，能不能写一遍？有没有轮子用都不如自己造。解决方式笔者根据自 ... [详细]

蜡笔小新 2024-11-21 10:21:24
string
c语言二元插值,二维线性插值c语言

c语言二元插值,二维线性插值c语言 ... [详细]

蜡笔小新 2024-11-20 12:20:16
string
C# 中创建和执行存储过程的方法

本文详细介绍了如何使用 C# 创建和调用 SQL Server 存储过程，包括连接数据库、定义命令类型、设置参数等步骤。 ... [详细]

蜡笔小新 2024-11-19 19:55:59
string
.NET 中使用 ADOX 创建 Access 数据库并定义表结构

在开发过程中，有时需要提供用户创建数据库的功能。本文介绍了如何利用 .NET 和 ADOX 在应用程序中实现创建 Access 数据库，并详细说明了创建数据库及表的具体步骤。 ... [详细]

蜡笔小新 2024-11-22 20:13:52
string
Java程序设计复习题

1、编写一个Java程序在屏幕上输出“你好！”。programmenameHelloworld.javapublicclassHelloworld{publicst ... [详细]

蜡笔小新 2024-11-22 20:05:03
go
视觉Transformer综述

本文综述了视觉Transformer在计算机视觉领域的应用，从原始Transformer出发，详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构，还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]

蜡笔小新 2024-11-22 19:53:16
string
基于SSM框架的在线考试系统：随机组卷功能详解

本文深入探讨了基于SSM（Spring, Spring MVC, MyBatis）框架构建的在线考试系统中，随机组卷功能的设计与实现方法。 ... [详细]

蜡笔小新 2024-11-22 19:00:26
string
深入解析 C++ 中的 String 和 Vector

本文详细介绍了 C++ 编程语言中 String 和 Vector 的使用方法及特性，旨在帮助开发者更好地理解和应用这两个重要的容器。 ... [详细]

蜡笔小新 2024-11-22 17:01:09
python
机器学习（ML）三之多层感知机

深度学习主要关注多层模型，现在以多层感知机（multilayerperceptron，MLP）为例，介绍多层神经网络的概念。隐藏层多层感知机在单层神经网络的基础上引入了一到多个隐藏 ... [详细]

蜡笔小新 2024-11-19 19:02:28
string
Python 脚本：获取字符串中所有字符的 ASCII 值

本文介绍如何编写 Python 程序，以获取并显示字符串中每个字符的 ASCII 值。 ... [详细]

蜡笔小新 2024-11-18 18:46:02
string
Java代码保护与混淆：ProGuard详解

在Java开发中，保护代码安全是一个重要的课题。由于Java字节码容易被反编译，因此使用代码混淆工具如ProGuard变得尤为重要。本文将详细介绍如何使用ProGuard进行代码混淆，以及其基本原理和常见问题。 ... [详细]

蜡笔小新 2024-11-18 16:46:17
go
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37

newbigstart

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章