当前位置: 开发笔记 > 编程语言 > 正文

CNN实现时间序列预测(PyTorch版)

作者：朱衅赝 | 来源：互联网 | 2023-08-08 10:32

CNN实现时间序列预测工具集Python3.8PyTorch1.10Jupyter6.3.0具体安装过程就不多赘述了:）数据集介绍本次实验使用的数据集是关于乙醇年销售额数据，该数据

CNN实现时间序列预测

工具集

Python3.8
PyTorch1.10
Jupyter6.3.0
具体安装过程就不多赘述了:&＃xff09;

数据集介绍

本次实验使用的数据集是关于乙醇年销售额数据&＃xff0c;该数据集是一个单变量时间序列&＃xff0c;数据集链接在本文末尾。
数据集格式&＃xff1a;

数据处理

加载数据集

import numpy as np import pandas as pd import matplotlib.pyplot as plt Dataset &＃061; pd.read_csv(&＃039;..\data\Alcohol_Sales.csv&＃039;, index_col&＃061;0,parse_dates&＃061;True)

查看数据集

len(Dataset)

Dataset.head()

plt.figure(figsize&＃061;(12,4)) plt.grid(True) plt.plot(df[&＃039;S4248SM144NCEN&＃039;]) plt.show()

数据预处理

y &＃061; df[&＃039;S4248SM144NCEN&＃039;].values.astype(float) test_size &＃061; 12 # 划分训练和测试集&＃xff0c;最后12个值作为测试集 train_set &＃061; y[:-test_size] test_set &＃061; y[-test_size:]

from sklearn.preprocessing import MinMaxScaler # 归一化处理 scaler &＃061; MinMaxScaler(feature_range&＃061;(-1, 1)) train_norm &＃061; scaler.fit_transform(train_set.reshape(-1, 1))

归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布&＃xff0c;归一化在-1–&＃043;1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算&＃xff0c;首先基本度量单位要同一&＃xff0c;神经网络是以样本在事件中的统计分别几率来进行训练&＃xff08;概率计算&＃xff09;和预测的&＃xff0c;且sigmoid函数的取值是0到1之间的&＃xff0c;网络最后一个节点的输出也是如此&＃xff0c;所以经常要对样本的输出归一化处理。归一化是统一在0-1之间的统计概率分布&＃xff0c;当所有样本的输入信号都为正值时&＃xff0c;与第一隐含层神经元相连的权值只能同时增加或减小&＃xff0c;从而导致学习速度很慢。另外在数据中常存在奇异样本数据&＃xff0c;奇异样本数据存在所引起的网络训练时间增加&＃xff0c;并可能引起网络无法收敛。为了避免出现这种情况及后面数据处理的方便&＃xff0c;加快网络学习速度&＃xff0c;可以对输入信号进行归一化&＃xff0c;使得所有样本的输入信号其均值接近于0或与其均方差相比很小。

创建训练集

# 转换成 tensor train_norm &＃061; torch.FloatTensor(train_norm).view(-1) window_size &＃061; 12 #将数据按window_size一组分段&＃xff0c;每次输入一段后&＃xff0c;会输出一个预测的值y_pred #y_pred与每段之后的window_size&＃043;1个数据作为对比值&＃xff0c;用于计算损失函数 #例如前5个数据为(1,2,3,4,5),取前4个进行CNN预测,得出的值与(5)比较计算loss #这里使用每组13个数据,最后一个数据作评估值,即window_size&＃061;12 def input_data(seq,ws): out &＃061; [] L &＃061; len(seq) for i in range(L-ws): window &＃061; seq[i:i&＃043;ws] label &＃061; seq[i&＃043;ws:i&＃043;ws&＃043;1] out.append((window, label)) return out train_data &＃061; input_data(train_norm,window_size) # 打印一组数据集 train_data[0]

建立CNN模型

对于CNN处理时序数据&＃xff0c;通常使用一维卷积网络Conv1d
本实验模型结构&＃xff1a;卷积层通过 2*2 卷积核将1维数据展开为3维张量&＃xff0c;使用激活函数ReLU将小于0的数据剔除&＃xff0c;再使用全连接层将3维张量变为1维张量&＃xff0c;接着通过两次Linear线性变换得到最后预测值。
卷积层-》ReLU-》全连接层-》线性层-》线性层

import torch import torch.nn as nn class CNNnetwork(nn.Module): def __init__(self): super().__init__() self.conv1d &＃061; nn.Conv1d(1,64,kernel_size&＃061;2) self.relu &＃061; nn.ReLU(inplace&＃061;True) self.Linear1&＃061; nn.Linear(64*11,50) self.Linear2&＃061; nn.Linear(50,1) def forward(self,x): x &＃061; self.conv1d(x) x &＃061; self.relu(x) x &＃061; x.view(-1) x &＃061; self.Linear1(x) x &＃061; self.relu(x) x &＃061; self.Linear2(x) return x

数据训练

import time torch.manual_seed(101) model &＃061;CNNnetwork() # 设置损失函数,这里使用的是均方误差损失 criterion &＃061; nn.MSELoss() # 设置优化函数和学习率lr optimizer &＃061; torch.optim.Adam(model.parameters(), lr&＃061;0.001) # 设置训练周期 epochs &＃061; 100 model.train() start_time &＃061; time.time() for epoch in range(epochs): for seq, y_train in train_data: # 每次更新参数前都梯度归零和初始化 optimizer.zero_grad() # 注意这里要对样本进行reshape&＃xff0c; # 转换成conv1d的input size&＃xff08;batch size, channel, series length&＃xff09; y_pred &＃061; model(seq.reshape(1,1,-1)) loss &＃061; criterion(y_pred, y_train) loss.backward() optimizer.step() print(f&＃039;Epoch: {epoch&＃043;1:2} Loss: {loss.item():10.8f}&＃039;) print(f&＃039;\nDuration: {time.time() - start_time:.0f} seconds&＃039;)

损失函数结果打印

数据预测

future &＃061; 12 # 选取序列最后12个值开始预测 preds &＃061; train_norm[-window_size:].tolist() # 设置成eval模式 model.eval() # 循环的每一步表示向时间序列向后滑动一格 for i in range(future): seq &＃061; torch.FloatTensor(preds[-window_size:]) with torch.no_grad(): preds.append(model(seq.reshape(1,1,-1)).item()) # 逆归一化还原真实值 true_predictions &＃061; scaler.inverse_transform(np.array(preds[window_size:]).reshape(-1, 1)) # 对比真实值和预测值 plt.figure(figsize&＃061;(12,4)) plt.grid(True) plt.plot(df[&＃039;S4248SM144NCEN&＃039;]) x &＃061; np.arange(&＃039;2018-02-01&＃039;, &＃039;2019-02-01&＃039;, dtype&＃061;&＃039;datetime64[M]&＃039;).astype(&＃039;datetime64[D]&＃039;) plt.plot(x,true_predictions) plt.show()

放大看一下

fig &＃061; plt.figure(figsize&＃061;(12,4)) plt.grid(True) fig.autofmt_xdate() plt.plot(df[&＃039;S4248SM144NCEN&＃039;][&＃039;2017-01-01&＃039;:]) plt.plot(x,true_predictions) plt.show()

总结

可以看出CNN处理时间序列数据表现得也可以&＃xff0c;可以考虑结合CNN-LSTM进行实验。
第一次写文&＃xff0c;若有错误&＃xff0c;欢迎批评指正(0.0)!

数据集及源码

链接&＃xff1a;https://pan.baidu.com/s/1Hwl8usFf4xpNAhV3jtLwhQ
提取码&＃xff1a;s58a

来源：freshfish丶

推荐阅读

int
自定义RecyclerView添加EmptyView

你知道RecyclerView里没有Em ... [详细]

蜡笔小新 2024-09-30 15:31:47
buffer
以下不是python文件读写方法的是Python 文件I/O

Python文件IO本章只讲述所有基本的IO函数，更多函数请参考Python标准文档。打印到屏幕最简单的输出方法是用print语句，你可以给它传递 ... [详细]

蜡笔小新 2024-09-30 14:49:29
int
UILabel的混合显示动画效果

UILabel的混合显示动画效果 ... [详细]

蜡笔小新 2024-09-29 20:18:24
int
Python | SymPy 排列. ascents()方法

Python|SymPy排列.ascents()方法原文 ... [详细]

蜡笔小新 2024-09-29 12:06:40
ip
Python多进程遇到的问题

多进程共享对象我有一个IpConnectionPool对象需要多个进程共享创建BaseManager注册Ip ... [详细]

蜡笔小新 2024-09-28 08:53:08
int
SciKitLearn标签编码器导致错误“参数必须是字符串或数字”

我有点困惑-在这里创建ML模型。我正在尝试从“大”数据框（180列）中获 ... [详细]

蜡笔小新 2024-09-26 18:39:21
int
大数据基础复习大三上

1.Python1.数据类型1.数字整形:int浮点型:float复数型：complex布尔型:bool2.字符串字符串：String3.与 ... [详细]

蜡笔小新 2024-09-26 12:44:43
ip
市场最快图表：LightningChart .NET v.10.4.1 Crack

LightningChart.NETv.10.4.1已经发布！新功能、新自定义控件和性能改进DataCursor：图表中自动数据跟踪的新功能。在以前的版 ... [详细]

蜡笔小新 2024-09-30 16:37:08
int
在JAVA代码的不同部分多次使用数组列表

我正在使用数组列表通过构建一个交互式菜单供用户选择来存储来自用户输入的值。到目前为止，我的两个选择是为用户提供向列表输入数据和读取列表的全部内容。到目前为止，我创建的代码由两个类组成。 ... [详细]

蜡笔小新 2024-09-30 10:25:00
ip
Mysql MySqlBulkLoader在.NET平台下的批量插入

批量导入publicboolTranBatchImpo ... [详细]

蜡笔小新 2024-09-30 10:20:25
match
文本生成图像简要回顾 text to image synthesis

摘要文本生成图像作为近几年的热门研究领域，其解决的问题是从一句描述性文本生成与之对应的图片。近一周来，我通过阅读了近几年发表于顶会的近10篇论文，做出本文中对该方向的 ... [详细]

蜡笔小新 2024-09-29 11:02:00
int
pyton纸牌游戏中的功能问题

我正在用python构建纸牌游戏（与Dobbel类似，如果您知道的话）。游戏在纸牌组中 ... [详细]

蜡笔小新 2024-09-28 11:10:43
int
把数字拆分成2的幂的和

问题：任何数都能分解成2的幂，比如71+1+1+1+1+1+11+1+1+1+1+21+1+1+2+21+2+2+2 ... [详细]

蜡笔小新 2024-09-26 17:01:41
int
python 英文关键词提取_如何提取文章的关键词（Python版）

项目需求：我们采集来的文章没有关键词，在发布的时候无法设定标签，我们通过代码自动提取出文章的关键词，达到对数据加工的目的。 ... [详细]

蜡笔小新 2024-09-26 10:32:12
int
iOS 获取变量属性：修改UIAlertController样式

iOS8之后系统把UIActionSheet和UIAlertView合并为了UIAlertController,使用就不比多说了,但在使用的过程中发现样式是固定的，点 ... [详细]

蜡笔小新 2024-09-26 10:11:40

朱衅赝

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章