当前位置: 开发笔记 > 编程语言 > 正文

Pytorch实战：基于鲸鱼WOA优化1DCNN的轴承故障诊断

作者：jny2272191 | 来源：互联网 | 2023-09-04 08:24

目录0.引言1.关键点2.WOA优化1DCNN超参数实战2.1数据准备2.21DCNN故障诊断建模2.3采用WOA优化1DCNN超参数0.引言采用1DCNN进行轴承故障诊

0.引言

1.关键点

2.WOA优化1DCNN超参数实战

2.1 数据准备

2.2 1DCNN故障诊断建模

2.3 采用WOA优化1DCNN超参数

0.引言

采用1DCNN进行轴承故障诊断建模，并基于鲸鱼优化算法WOA对1DCNN的超参数进行优化，以实现更高的精度。建立一个两层的1DCNN，优化的参数包括学习率、训练次数、batchsize，卷积层1的核数量、核大小，池化层1的核大小，卷积层2的核数量、核大小，池化层2的核大小，全连接层1、全连接层2的节点数，总共11个超参数。

1.关键点

在Pytorch中，卷积层与池化层由于无法像tensorflow中一样，将padding设置成“same”模式，因此每一层的输出要手动计算，并且与全连接层的输入节点参数也要精确计算出来，否则节点数不匹配，容易报错。而我们采用优化算法来进行优化的，每一层的参数不是固定的，所以第一步是实现像tensorflow中一样，将卷积层与池化层设计成padding具备“same”模式的结构，代码如下：

class Conv1d(torch.nn.Module):def __init__(self, in_channels, out_channels, kernel_size, bias=True, padding_layer=nn.ReflectionPad1d):super().__init__()ka = kernel_size // 2kb = ka - 1 if kernel_size % 2 == 0 else kaself.net = torch.nn.Sequential(padding_layer((ka,kb)),nn.Conv1d(in_channels, out_channels, kernel_size, bias=bias))def forward(self, x):return self.net(x)class MaxPool1d(torch.nn.Module):def __init__(self, kernel_size):super().__init__()self.net=torch.nn.MaxPool1d(kernel_size=kernel_size)def forward(self, x):x1=self.net(x)padsize=x.size(2)-x1.size(2)ka = padsize // 2kb = ka if padsize % 2 == 0 else ka+1return F.pad(x1,(ka,kb))net1=Conv1d(1,3,10)#输入通道、输出通道数、卷积核大小 net2=MaxPool1d(3)#池化核大小 dummy=torch.rand(16,1,101) print(net1(dummy).size()) print(net1(dummy).size()) # torch.Size([16, 3, 101]) # torch.Size([16, 3, 101])

可以看出，无论怎么设置输入的长度，与卷积、池化参数，他的输出长度都是与输入的长度都是一样的。

采用上述代码设计一个两层的1DCNN，代码如下

class ConvNet(torch.nn.Module):def __init__(self,num_input,nk1,k1,pk1,nk2,k2,pk2,fc1,fc2, num_classes):super(ConvNet, self).__init__()# 1D-CNN 输入1*1024振动信号self.net = nn.Sequential(Conv1d(1,nk1 , kernel_size=k1), MaxPool1d(kernel_size=pk1), nn.ReLU(), nn.BatchNorm1d(nk1),Conv1d(nk1, nk2, kernel_size=k2), MaxPool1d(kernel_size=pk2), nn.ReLU(), nn.BatchNorm1d(nk2))self.feature_extractor = nn.Sequential(nn.Linear(num_input*nk2, fc1),nn.ReLU(), # nn.Dropout(0.5),nn.Linear(fc1, fc2)) self.classifier=nn.Sequential(nn.ReLU(),nn.Linear(fc2, num_classes),)def forward(self,x):x= self.net(x)#进行卷积+池化操作提取振动信号特征x=x.view(-1, x.size(1)*x.size(2))feature = self.feature_extractor(x)#将上述特征拉伸为向量输入进全连接层实现分类logits = self.classifier(feature)#将上述特征拉伸为向量输入进全连接层实现分类probas = F.softmax(logits, dim=1)# softmax分类器return logits,probasnet=ConvNet(101,8,3,3,16,3,4,128,128,10) dummy=torch.rand(16,1,101) print(net(dummy)[0].size()) # torch.Size([16, 10]) net=ConvNet(111,8,7,3,16,7,4,256,128,10) dummy=torch.rand(16,1,111) print(net(dummy)[0].size()) # torch.Size([16, 10])

可以看出，无论怎么设置输入的长度，与卷积、池化参数，他的输出都是16x10（16是batchsize，10是类别数）

2.WOA优化1DCNN超参数实战

2.1 数据准备

数据依旧采用48k的驱动端轴承故障诊断数据，每种故障样本数为200，每个样本的长度为1024，按照7：2：1的比例划分训练集、验证集、测试集

#coding:utf-8from scipy.io import loadmat from scipy.io import savematimport numpy as np import os from sklearn import preprocessing # 0-1编码 from sklearn.model_selection import StratifiedShuffleSplit # 随机划分，保证每一类比例相同def prepro(d_path, length=864, number=1000, normal=True, rate=[0.7, 0.2, 0.1], enc=True, enc_step=28):"""对数据进行预处理,返回train_X, train_Y, valid_X, valid_Y, test_X, test_Y样本.:param d_path: 源数据地址:param length: 信号长度，默认2个信号周期，864:param number: 每种信号个数,总共10类,默认每个类别1000个数据:param normal: 是否标准化.True,Fales.默认True:param rate: 训练集/验证集/测试集比例.默认[0.5,0.25,0.25],相加要等于1:param enc: 训练集、验证集是否采用数据增强.Bool,默认True:param enc_step: 增强数据集采样顺延间隔:return: Train_X, Train_Y, Valid_X, Valid_Y, Test_X, Test_Y```import preprocess.preprocess_nonoise as pretrain_X, train_Y, valid_X, valid_Y, test_X, test_Y = pre.prepro(d_path=path,length=864,number=1000,normal=False,rate=[0.5, 0.25, 0.25],enc=True,enc_step=28)```"""# 获得该文件夹下所有.mat文件名filenames = os.listdir(d_path)def capture(original_path):"""读取mat文件，返回字典:param original_path: 读取路径:return: 数据字典"""files = {}for i in filenames:# 文件路径file_path = os.path.join(d_path, i)file = loadmat(file_path)file_keys = file.keys()for key in file_keys:if &＃39;DE&＃39; in key:files[i] = file[key].ravel()return filesdef slice_enc(data, slice_rate=rate[1] + rate[2]):"""将数据切分为前面多少比例，后面多少比例.:param data: 单挑数据:param slice_rate: 验证集以及测试集所占的比例:return: 切分好的数据"""keys = data.keys()Train_Samples = {}Test_Samples = {}for i in keys:slice_data = data[i]all_lenght = len(slice_data)end_index = int(all_lenght * (1 - slice_rate))samp_train = int(number * (1 - slice_rate)) # 700Train_sample = []Test_Sample = []if enc:enc_time = length // enc_stepsamp_step = 0 # 用来计数Train采样次数for j in range(samp_train):random_start = np.random.randint(low=0, high=(end_index - 2 * length))label = 0for h in range(enc_time):samp_step += 1random_start += enc_stepsample = slice_data[random_start: random_start + length]Train_sample.append(sample)if samp_step == samp_train:label = 1breakif label:breakelse:for j in range(samp_train):random_start = np.random.randint(low=0, high=(end_index - length))sample = slice_data[random_start:random_start + length]Train_sample.append(sample)# 抓取测试数据for h in range(number - samp_train):random_start = np.random.randint(low=end_index, high=(all_lenght - length))sample = slice_data[random_start:random_start + length]Test_Sample.append(sample)Train_Samples[i] = Train_sampleTest_Samples[i] = Test_Samplereturn Train_Samples, Test_Samples# 仅抽样完成，打标签def add_labels(train_test):X = []Y = []label = 0for i in filenames:x = train_test[i]X += xlenx = len(x)Y += [label] * lenxlabel += 1return X, Y# one-hot编码def one_hot(Train_Y, Test_Y):Train_Y = np.array(Train_Y).reshape([-1, 1])Test_Y = np.array(Test_Y).reshape([-1, 1])Encoder = preprocessing.OneHotEncoder()Encoder.fit(Train_Y)Train_Y = Encoder.transform(Train_Y).toarray()Test_Y = Encoder.transform(Test_Y).toarray()Train_Y = np.asarray(Train_Y, dtype=np.int32)Test_Y = np.asarray(Test_Y, dtype=np.int32)return Train_Y, Test_Ydef scalar_stand(Train_X, Test_X):# 用训练集标准差标准化训练集以及测试集scalar = preprocessing.StandardScaler().fit(Train_X)Train_X = scalar.transform(Train_X)Test_X = scalar.transform(Test_X)return Train_X, Test_Xdef valid_test_slice(Test_X, Test_Y):test_size = rate[2] / (rate[1] + rate[2])ss = StratifiedShuffleSplit(n_splits=1, test_size=test_size)for train_index, test_index in ss.split(Test_X, Test_Y):X_valid, X_test = Test_X[train_index], Test_X[test_index]Y_valid, Y_test = Test_Y[train_index], Test_Y[test_index]return X_valid, Y_valid, X_test, Y_test# 从所有.mat文件中读取出数据的字典data = capture(original_path=d_path)# 将数据切分为训练集、测试集train, test = slice_enc(data)# 为训练集制作标签，返回X，YTrain_X, Train_Y = add_labels(train)# 为测试集制作标签，返回X，YTest_X, Test_Y = add_labels(test)# 为训练集Y/测试集One-hot标签Train_Y, Test_Y = one_hot(Train_Y, Test_Y)# 训练数据/测试数据是否标准化.if normal:Train_X, Test_X = scalar_stand(Train_X, Test_X)else:# 需要做一个数据转换，转换成np格式.Train_X = np.asarray(Train_X)Test_X = np.asarray(Test_X)# 将测试集切分为验证集合和测试集.Valid_X, Valid_Y, Test_X, Test_Y = valid_test_slice(Test_X, Test_Y)return Train_X, Train_Y, Valid_X, Valid_Y, Test_X, Test_Yif __name__ == "__main__":path = &＃39;0HP/&＃39;train_X, train_Y, valid_X, valid_Y, test_X, test_Y = prepro(d_path=path,length=1024,number=200,normal=True,rate=[0.7, 0.2, 0.1],enc=False,enc_step=28)savemat("data_process.mat", {&＃39;train_X&＃39;: train_X,&＃39;train_Y&＃39;: train_Y,&＃39;valid_X&＃39;: valid_X,&＃39;valid_Y&＃39;: valid_Y,&＃39;test_X&＃39;: test_X,&＃39;test_Y&＃39;: test_Y})

2.2 1DCNN故障诊断建模

基于1中的1DCNN进行故障诊断建模，参数我们随意设置，测试集精度为80.5%（可以手动调参，提高精度，不过我比较懒，而且要对比出优化的重要性）

# coding: utf-8 # In[1]: 导入必要的库函数import numpy as np import torch import torch.nn as nn import torch.nn.functional as F from sklearn.preprocessing import MinMaxScaler,StandardScaler from model import ConvNet,Model_fit import matplotlib.pyplot as plt if torch.cuda.is_available():torch.backends.cudnn.deterministic = True from scipy.io import loadmat device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")# In[2] 加载数据 num_classes=10# 振动信号----1D-CNN输入 data=loadmat(&＃39;data_process.mat&＃39;) x_train1=data[&＃39;train_X&＃39;] x_valid1=data[&＃39;valid_X&＃39;] y_train=data[&＃39;train_Y&＃39;].argmax(axis=1) y_valid=data[&＃39;valid_Y&＃39;].argmax(axis=1) ss1=StandardScaler().fit(x_train1) #MinMaxScaler StandardScaler x_train1=ss1.transform(x_train1) x_valid1=ss1.transform(x_valid1)x_train1=x_train1.reshape(-1,1,1024) x_valid1=x_valid1.reshape(-1,1,1024)# 转换为torch的输入格式 train_features1 = torch.tensor(x_train1).type(torch.FloatTensor) valid_features1 = torch.tensor(x_valid1).type(torch.FloatTensor)train_labels = torch.tensor(y_train).type(torch.LongTensor) valid_labels = torch.tensor(y_valid).type(torch.LongTensor)print(train_features1.shape) print(train_labels.shape)N=train_features1.size(0)# In[3]: 参数设置 learning_rate = 0.005#学习率 num_epochs = 10#迭代次数 batch_size = 64 #batchsize # In[4]: 模型设置 torch.manual_seed(0) torch.cuda.manual_seed(0) model=ConvNet(train_features1.size(-1),8,3,3,16,3,4,128,128,10) train_again=True # True就重新训练 if train_again: # In[5]:Model=Model_fit(model,batch_size,learning_rate,num_epochs,device,verbose=True)Model.train(train_features1,train_labels,valid_features1,valid_labels)model= Model.modeltrain_loss=Model.train_lossvalid_loss=Model.valid_lossvalid_acc=Model.valid_acctrain_acc=Model.train_acctorch.save(model,&＃39;model/W_CNN1.pkl&＃39;)#保存整个网络参数# In[] #loss曲线plt.figure()plt.plot(np.array(train_loss),label=&＃39;train&＃39;)plt.plot(np.array(valid_loss),label=&＃39;valid&＃39;)plt.title(&＃39;loss curve&＃39;)plt.legend()plt.savefig(&＃39;图片保存/loss&＃39;)# accuracy 曲线plt.figure()plt.plot(np.array(train_acc),label=&＃39;train&＃39;)plt.plot(np.array(valid_acc),label=&＃39;valid&＃39;)plt.title(&＃39;accuracy curve&＃39;)plt.legend()plt.savefig(&＃39;图片保存/accuracy&＃39;)plt.show() else:model=torch.load(&＃39;model/W_CNN1.pkl&＃39;,map_location=torch.device(&＃39;cpu&＃39;))#加载模型Model=Model_fit(model,batch_size,learning_rate,num_epochs,device,verbose=True)# In[6]: 利用训练好的模型对测试集进行分类#提取测试集 x_test1=data[&＃39;test_X&＃39;] y_test=data[&＃39;test_Y&＃39;].argmax(axis=1)x_test1=ss1.transform(x_test1) x_test1=x_test1.reshape(-1,1,1024)test_features1 = torch.tensor(x_test1).type(torch.FloatTensor)test_labels = torch.tensor(y_test).type(torch.LongTensor)_,teac=Model.compute_accuracy(test_features1,test_labels) print(&＃39;CNN直接分类的测试集正确率为：&＃39;,teac*100,&＃39;%&＃39;)

2.3 采用WOA优化1DCNN超参数

以最小化验证集分类错误率为适应度函数进行网络优化，目的是找到一组最优超参数，使得训练好的网络的验证集分类错误率最低。

# coding: utf-8 # In[1]: 导入必要的库函数import numpy as np import torch import torch.nn as nn import torch.nn.functional as F from sklearn.preprocessing import MinMaxScaler,StandardScaler from model import ConvNet,Model_fit from optim import WOA,HUATU import matplotlib.pyplot as plt if torch.cuda.is_available():torch.backends.cudnn.deterministic = True from scipy.io import loadmat device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") #torch.manual_seed(0)# In[2] 加载数据 num_classes=10# 振动信号----1D-CNN输入 data=loadmat(&＃39;data_process.mat&＃39;) x_train1=data[&＃39;train_X&＃39;] x_valid1=data[&＃39;valid_X&＃39;] y_train=data[&＃39;train_Y&＃39;].argmax(axis=1) y_valid=data[&＃39;valid_Y&＃39;].argmax(axis=1) ss1=StandardScaler().fit(x_train1) #MinMaxScaler StandardScaler x_train1=ss1.transform(x_train1) x_valid1=ss1.transform(x_valid1)x_train1=x_train1.reshape(-1,1,1024) x_valid1=x_valid1.reshape(-1,1,1024)# 转换为torch的输入格式 train_features1 = torch.tensor(x_train1).type(torch.FloatTensor) valid_features1 = torch.tensor(x_valid1).type(torch.FloatTensor)train_labels = torch.tensor(y_train).type(torch.LongTensor) valid_labels = torch.tensor(y_valid).type(torch.LongTensor)# In[] WOA优化CNN optim_again = True # 为 False 的时候就直接加载之间优化好的超参建建 # 训练模型 if optim_again:best,trace,process=WOA(train_features1,train_labels,valid_features1,valid_labels)trace,process=np.array(trace),np.array(process)np.savez(&＃39;model/woa_result.npz&＃39;,trace=trace,best=best,process=process) else:para=np.load(&＃39;model/woa_result.npz&＃39;)trace=para[&＃39;trace&＃39;].reshape(-1,)process=para[&＃39;process&＃39;]best=para[&＃39;best&＃39;].reshape(-1,) HUATU(trace) # In[3]: 参数设置 pop=best learning_rate = pop[0] # 学习率 num_epochs = int(pop[1]) # 迭代次数 batch_size = int(pop[2]) # batchsizenk1 = int(pop[3]) # conv1核数量 k1 = int(pop[4]) # conv1核大小 pk1 = int(pop[5]) # pool1核大小nk2 = int(pop[6]) # conv2核数量 k2 = int(pop[7]) # conv2核大小 pk2 = int(pop[8]) # pool2核大小fc1 = int(pop[9]) #全连接层1节点数 fc2 = int(pop[10]) #全连接层2节点数 torch.manual_seed(0) torch.cuda.manual_seed(0) model=ConvNet(train_features1.size(-1),nk1,k1,pk1,nk2,k2,pk2,fc1,fc2,10) train_again= True #True 就重新训练 # In[5]: if train_again: Model=Model_fit(model,batch_size,learning_rate,num_epochs,device,verbose=True)Model.train(train_features1,train_labels,valid_features1,valid_labels)model= Model.modeltrain_loss=Model.train_lossvalid_loss=Model.valid_lossvalid_acc=Model.valid_acctrain_acc=Model.train_acctorch.save(model,&＃39;model/W_CNN2.pkl&＃39;)#保存整个网络参数#loss曲线plt.figure()plt.plot(np.array(train_loss),label=&＃39;train&＃39;)plt.plot(np.array(valid_loss),label=&＃39;valid&＃39;)plt.title(&＃39;loss curve&＃39;)plt.legend()plt.savefig(&＃39;图片保存/loss&＃39;)# accuracy 曲线plt.figure()plt.plot(np.array(train_acc),label=&＃39;train&＃39;)plt.plot(np.array(valid_acc),label=&＃39;valid&＃39;)plt.title(&＃39;accuracy curve&＃39;)plt.legend()plt.savefig(&＃39;图片保存/accuracy&＃39;)plt.show() else:model=torch.load(&＃39;model/W_CNN2.pkl&＃39;,map_location=torch.device(&＃39;cpu&＃39;))#加载模型Model=Model_fit(model,batch_size,learning_rate,num_epochs,device,verbose=True)# In[6]: 利用训练好的模型对测试集进行分类#提取测试集 x_test1=data[&＃39;test_X&＃39;] y_test=data[&＃39;test_Y&＃39;].argmax(axis=1)x_test1=ss1.transform(x_test1) x_test1=x_test1.reshape(-1,1,1024)test_features1 = torch.tensor(x_test1).type(torch.FloatTensor)test_labels = torch.tensor(y_test).type(torch.LongTensor)_,teac=Model.compute_accuracy(test_features1,test_labels) print(&＃39;WOA-CNN分类的测试集正确率为：&＃39;,teac*100,&＃39;%&＃39;)

由于是最小化验证集分类错误率为适应度函数，所以适应度曲线是一条下降的曲线。

3.代码

代码链接见评论区我的评论

推荐阅读

command
微软推出Windows Terminal Preview v0.10

微软近期发布了Windows Terminal Preview v0.10，用户可以在微软商店或GitHub上获取这一更新。该版本在2月份发布的v0.9基础上，新增了鼠标输入和复制Pane等功能。 ... [详细]

蜡笔小新 2024-11-12 16:15:56
tree
使用Netzob逆向未知协议的技术指南

本文详细介绍如何使用Netzob工具逆向未知通信协议，涵盖从基本安装到高级模糊测试的全过程。通过实例演示，帮助读者掌握Netzob的核心功能。 ... [详细]

蜡笔小新 2024-11-14 18:24:15
install
使用 Jupyter Notebook 实现 Markdown 编写与代码运行

Jupyter Notebook 是一个开源的基于网页的应用程序，允许用户在同一文档中编写 Markdown 文本和运行多种编程语言的代码，并实时查看运行结果。 ... [详细]

蜡笔小新 2024-11-15 14:50:50
install
vue引入echarts地图的四种方式

一、vue中引入echart1、安装echarts:npminstallecharts--save2、在main.js文件中引入echarts实例: Vue.prototype.$echartsecharts3、在需要用到echart图形的vue文件中引入: importechartsfrom&quot;echarts&quot;;4、如果用到map（地图），还 ... [详细]

蜡笔小新 2024-11-15 13:07:46
include
第14周实践项目（4）-验证平衡二叉树

问题**Copyright(c)2015,烟台大学计算机学院*Allrightsreserved.*文件名称：test.cpp*作者：王敏*完成日 ... [详细]

蜡笔小新 2024-11-15 11:49:00
object
WPF项目学习.一

WPF项目搭建版权声明：本文为博主初学经验，未经博主允许不得转载。一、前言记录在学习与制作WPF过程中遇到的解决方案。使用MVVM的优点是数据和视图分离，双向绑定，低耦合，可重用行 ... [详细]

蜡笔小新 2024-11-15 11:38:43
java
普通树(每个节点可以有任意数量的子节点)级序遍历

普通树(每个节点可以有任意数量的子节点)级序遍历 ... [详细]

蜡笔小新 2024-11-14 18:53:26
java
自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析

目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]

蜡笔小新 2024-11-14 18:21:21
foreach
如何在文件中存储和读取字典对象

本文介绍了如何将包含复杂对象的字典保存到文件，并从文件中读取这些字典。 ... [详细]

蜡笔小新 2024-11-14 15:20:48
web
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
foreach
C#实现文件的压缩与解压

2019独角兽企业重金招聘Python工程师标准一、准备工作1、下载ICSharpCode.SharpZipLib.dll文件2、项目中引用这个dll二、文件压缩与解压共用类 ... [详细]

蜡笔小新 2024-11-14 10:37:34
java
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
config
Spark与HBase结合处理大规模流量数据结构设计

本文将详细介绍如何利用Spark和HBase进行大规模流量数据的分析与处理，包括数据结构的设计和优化方法。 ... [详细]

蜡笔小新 2024-11-12 19:49:05
java
字节流(InputStream和OutputStream)，字节流读写文件，字节流的缓冲区，字节缓冲流

字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream，所有的输出流都继承子OutputStreamInput ... [详细]

蜡笔小新 2024-11-12 14:07:25
config
利用Python Paramiko库批量更新多台服务器的登录密码

本文介绍了如何使用Python的Paramiko库批量更新多台服务器的登录密码。通过示例代码展示了具体实现方法，确保了操作的高效性和安全性。Paramiko库提供了强大的SSH2协议支持，使得远程服务器管理变得更加便捷。此外，文章还详细说明了代码的各个部分，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-11 19:17:23

jny2272191

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章