当前位置: 开发笔记 > 编程语言 > 正文

一个最基本的RNN训练框架用于多元回归(基于pytorch)

作者：手机用户2602935395 | 来源：互联网 | 2023-10-12 08:44

0.摘要本文主要描述如何搭建一个RNN的基本训练架构.主要从如何读取CSV文件中的数据,构建数据管道.如何搭建模型,如何在主函数中开启训练.未完，待更新

0. 摘要

本文主要描述如何搭建一个RNN的基本训练架构.主要从如何读取CSV文件中的数据,构建数据管道. 如何搭建模型,如何在主函数中开启训练.

未完，待更新

1. RNN的基础知识

一个最简单的RNN结构展开图, X(t)表示循环神经网络在时刻t的输入,H是循环神经网络的主体结构,循环的过程就是H被不断执行的过程.O(t)代表t时刻循环神经网路的输出.

简单描述一下具体的过程:

在t时刻,H会读取输入层的输入x(t),并输出一个值O(t),同时H的状态值会从当前步传递到下一步.

也就是讲:H的输入除了来自输入层的输入x(t),还依赖于上一时刻的H(t-1).

一般情况下,输入层的x为下图所示:

为了研究方便,下文的叙述令in_putsize = 1.下面使用

2. 一个RNN小实验

2.1 数据集准备

链接：https://pan.baidu.com/s/1HorFNE5mlDgAvFXU6_JXfQ
提取码：x521
train_data: 里面包含6列数据, 每一行作为一个训练输入, 其对应的输出在train_label所对应的行.

train_label: 里面包含1列数据

2.2 设计设计pytorch的数据管道

设计dataloader data_loader.py

import torch import numpy as np class ImageFolder(torch.utils.data.Dataset): def __init__(self, train_data): self.data_sorce = np.array(train_data.iloc[:, 0:6]) self.data_lable = np.array(train_data.iloc[:, 6:7]) def __getitem__(self, index): # index = 0 id_data = list(self.data_sorce)[index] # id_data = list(data_sorce)[index] id_lable = list(self.data_lable)[index] # list(data_lable)[index] data = torch.Tensor(id_data).unsqueeze(1) label = torch.Tensor(id_lable) return data, label def __len__(self): return len(list(self.data_lable))

简单讲解一些这段代码:

这个是pytorch的快速数据管道的构造的基本架构, 一般情况下需要重新构造下面三个方法

__init__(self, train_data): 类初始化的时候, 需要传入一个靶向文件

__getitem__(self, index): 这个方法会在程序运行的时候,自动调用函数体里面的相关内容,同样也是构造子类的输出

__len__(self): 就如同名字一样,返回的数据集的长度

搭建模型文件, modelnet.py

import torch from torch import nn class Rnn(nn.Module): def __init__(self, INPUT_SIZE): super(Rnn, self).__init__() self.hidden_size = 20 self.num_layers = 2 self.rnn = nn.RNN( input_size=INPUT_SIZE, hidden_size=self.hidden_size, num_layers=self.num_layers, batch_first=True ) self.out = nn.Linear(self.hidden_size, 1) def forward(self, x): r_out, h_state = self.rnn(x, None)# outs = [] for time in range(r_out.size(1)): outs.append(self.out(r_out[:, time, :])) return torch.stack(outs, dim=1), h_state

该modelnet.py文件中的输入参数有:

INPUT_SIZE:(非超参数) 该参数应等于输入序列的特征的维度

self.hidden_size:(超参数)=>输出结果特征层的维度

self.num_layers:(超参数)=>循环神经网络的层数

由于每个时间间隔的输入都会对应相应的输出(输出也具有维度[hadden_sizes]的向量), 本文中hadden_sizes设置大于1,

通过一个全连接层将输出的特征向量转换为标量作为最终的输出,当然可以根据具体的需求来转化.转换过程如下代码所示.

outs = [] for time in range(r_out.size(1)): outs.append(self.out(r_out[:, time, :]))

for循环,可以得到每一个时间间隔所对应的输出. last_result = torch.stack(outs, dim=1) 的size为[batch,time_setp,1]

下面贴主函数的代码: main.py

import numpy as np import matplotlib.pyplot as plt import torch from torch import nn from modelnet import Rnn from sklearn.model_selection import train_test_split import pandas as pd from data_loader import ImageFolder from tqdm import trange '''1.数据准备阶段 ''' # 导入训练数据文件 data_path = './Zhou_X.csv' label_path = './Zhou_Y.csv' # 指定输出的文件 txt_path = 'Zhou_X.txt' # 定义一些超参数 INPUT_SIZE = 1 # 输入序列的特征维度 LR = 0.0001 # 学习率 BATCHSIZE_PER_CARD = 1 # batch_size total_epoch = 40 # 总的训练循环次数 # 读取csv文件, sep = ' '代表表中的数据分割方式是' ' header = None是文件中没有关键字 data_train = pd.read_csv(data_path,sep = ' ',header=None) data_label = pd.read_csv(label_path,header=None) # 训练数据和标签放在同一个容器中, axis是按列拼接 data_get = pd.concat([data_train,data_label], axis=1) # data.iloc[:, 0:13] # 按位置取某几列 # 将数据集划分为训练集和测试集 train_data, test_data = train_test_split(data_get,\ train_size=0.7,random_state=0.1,\ shuffle=False) ################################################################# '''2.开始构造训练框架''' # 2.1构造pipe line train_batchsize = torch.cuda.device_count() * BATCHSIZE_PER_CARD val_batchsize = torch.cuda.device_count() * BATCHSIZE_PER_CARD train_dataset = ImageFolder(train_data) test_dataset = ImageFolder(test_data) data_loader = torch.utils.data.DataLoader( train_dataset, batch_size=train_batchsize, shuffle=True, num_workers=0) val_data_loader = torch.utils.data.DataLoader( test_dataset, batch_size=val_batchsize, shuffle=True, num_workers=0) # 2.2 选择模型 model = Rnn(INPUT_SIZE) print(model) # 2.3 定义优化器和损失函数 optimizer = torch.optim.Adam(model.parameters(), lr=LR) loss_func = nn.MSELoss() # loss_func = nn.CrossEntropyLoss() # 2.4 启动训练 global_step = 1 for epoch in range(1, total_epoch + 1): print('\n---------- Epoch:' + str(epoch) + ' ----------') data_loader_iter = iter(data_loader) train_epoch_loss = 0 test_epoch_loss = 0 with trange(len(data_loader_iter)) as t: for index in t: train_data_input, train_data_label = data_loader_iter.next() # x = torch.from_numpy(train_data_input) prediction, h_state = model(train_data_input) loss = loss_func(prediction[:,-1,:][0], train_data_label[0]) optimizer.zero_grad() loss.backward() optimizer.step() global_step +=1 train_epoch_loss = train_epoch_loss + loss t.set_postfix(step= global_step,loss = loss.data.numpy(), aver_loss= train_epoch_loss.data.numpy()/(index+1), learing_rate = LR) data_loader_iter = iter(val_data_loader) with trange(len(data_loader_iter)) as t: for index in t: with torch.no_grad(): train_data_input, train_data_label = data_loader_iter.next() prediction, h_state = model(train_data_input) loss = loss_func(prediction[:,-1,:][0], train_data_label[0]) test_epoch_loss = test_epoch_loss + loss t.set_postfix(step= global_step,loss = loss.data.numpy(), aver_loss= test_epoch_loss.data.numpy()/(index+1), learing_rate = LR) # 整体预测 all_data = ImageFolder(data_get) all_data_loader = torch.utils.data.DataLoader( all_data, batch_size=1, shuffle=False, num_workers=0) data_loader_iter = iter(all_data_loader) input_caclaue = [] loss_caclaue = [] result = [] with trange(len(data_loader_iter)) as t: for index in t: with torch.no_grad(): train_data_input, train_data_label = data_loader_iter.next() prediction, h_state = model(train_data_input) loss = loss_func(prediction[:,-1,:][0], train_data_label[0]) input_caclaue.append([train_data_input.data.numpy(),train_data_label.data.numpy()]) result.append(prediction[:,-1,:][0].data.numpy()) loss_caclaue.append(loss.data.numpy()) t.set_postfix(step = index,loss = loss.data.numpy(), aver_loss= test_epoch_loss/(index+1)) with open(txt_path,"w") as f: for index in range(len(result)): pass # index = 0 str1 = '' for iterm in input_caclaue[index][0][0]: str1 = str1 + str(iterm[0]) + ' ' str2 = str(input_caclaue[index][1][0][0]) str3 = str(result[index][0]) str4 = str(loss_caclaue[index]) str_all = str1 + str2 + ' ' + str3 + ' ' + str4 + '\n' f.write(str_all) # 自带文件关闭功能，不需要再写f.close()

推荐阅读

random
利用决策树预测NBA比赛胜负的Python数据挖掘实践

本文通过使用2013-14赛季NBA赛程与结果数据集以及2013年NBA排名数据，结合《Python数据挖掘入门与实践》一书中的方法，展示如何应用决策树算法进行比赛胜负预测。我们将详细讲解数据预处理、特征工程及模型评估等关键步骤。 ... [详细]

蜡笔小新 2024-12-23 09:07:40
ip
备战BAT面试：掌握这些MySQL核心问题

本文深入探讨了MySQL中常见的面试问题，包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析，帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]

蜡笔小新 2024-12-20 18:58:01
copy
ML学习笔记20210824分类算法模型选择与调优

3.模型选择和调优3.1交叉验证定义目的为了让模型得精度更加可信3.2超参数搜索GridSearch对K值进行选择。k[1,2,3,4,5,6]循环遍历搜索。API参数1& ... [详细]

蜡笔小新 2024-12-19 09:10:33
copy
导入大csv文件到mysql（CSV导入）

导入大csv文件到mysql（CSV导入） ... [详细]

蜡笔小新 2024-12-12 15:01:40
ip
iBatis.NET 循环迭代：深入解析 Iterate 标签

本文详细介绍了 iBatis.NET 中的 Iterate 元素，它用于遍历集合并重复生成每个项目的主体内容。通过该元素，可以实现类似于 foreach 的功能，尽管 iBatis.NET 并未直接提供 foreach 标签。 ... [详细]

蜡笔小新 2024-12-23 18:51:40
testing
优化SQL Server批量数据插入存储过程的实现

本文介绍了一种改进的SQL Server存储过程，用于生成批量插入语句。该方法不仅提高了性能，还支持单行和多行模式，适用于SQL Server 2005及以上版本。 ... [详细]

蜡笔小新 2024-12-21 06:43:52
list
基于决策树的性别分类分析

本文旨在探讨如何利用决策树算法实现对男女性别的分类。通过引入信息熵和信息增益的概念，结合具体的数据集，详细介绍了决策树的构建过程，并展示了其在实际应用中的效果。 ... [详细]

蜡笔小新 2024-12-20 11:57:25
range
java文本编辑器,java文本编辑器设计思路

java文本编辑器,java文本编辑器设计思路 ... [详细]

蜡笔小新 2024-12-19 21:02:48
text
使用JFreeChart绘制环形图

本文介绍了如何使用JFreeChart库创建一个美观且功能丰富的环形图。通过设置主题、字体和颜色等属性，可以生成符合特定需求的图表。 ... [详细]

蜡笔小新 2024-12-19 16:26:09
range
深入浅出TensorFlow数据读写机制

本文详细介绍TensorFlow中的数据读写操作，包括TFRecord文件的创建与读取，以及数据集（dataset）的相关概念和使用方法。 ... [详细]

蜡笔小新 2024-12-19 16:23:17
request
主板市盈率、市净率及股息率的自动化抓取

本文介绍了如何通过Python脚本自动从中国指数有限公司网站抓取主板的市盈率、市净率和股息率等关键财务指标，并将这些数据存储到CSV文件中。涉及的技术包括网页解析、正则表达式以及异常处理。 ... [详细]

蜡笔小新 2024-12-15 14:26:17
list
SparkSQL 中 DataFrame 的构建方法

本文详细探讨了如何在 SparkSQL 中创建 DataFrame，涵盖了从基本概念到具体实践的各种方法。作为持续学习的一部分，本文将持续更新以提供最新信息。 ... [详细]

蜡笔小新 2024-12-10 18:55:21
list
理解与应用：独热编码（One-Hot Encoding）

本文详细介绍了独热编码（One-Hot Encoding）与哑变量编码（Dummy Encoding）两种方法，用于将分类变量转换为数值形式，以便于机器学习算法处理。文章不仅解释了这两种编码方式的基本原理，还探讨了它们在实际应用中的差异及选择依据。 ... [详细]

蜡笔小新 2024-12-19 13:40:33
ip
400string(99) php,PHP: 字符串Manual

addcslashes—以C语言风格使用反斜线转义字符串中的字符addslashes—使用反斜线引用字符串bin2hex—函数把包含数据的二进制字符串转换为十六进制值chop—rt ... [详细]

蜡笔小新 2024-12-15 12:31:43
range
Python并行处理：提升数据处理速度的方法与实践

本文探讨了如何利用Python进行数据处理的并行化，通过介绍Numba、多进程处理以及Pandas DataFrame上的并行操作等技术，旨在帮助开发者有效提高数据处理效率。 ... [详细]

蜡笔小新 2024-12-14 11:30:03

手机用户2602935395

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章