热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

pytorch(一):torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu

目录

预备知识

导包

构建数据集

神经网络结构

训练测试精度可视化

计算模型精度

损失可视化

输出网络结构信息

训练神经网络

定义参数

载入数据

载入神经网络结构、损失及优化

训练及测试

损失、精度可视化

question


预备知识



  1. pytorch(二):torch常用API应用及详解、torch.max()
  2. 卷积层设置及输出大小计算
  3. torch.utils.data.DataLoader使用方法
  4. 加载手写数据集load_digits()
  5. sklearn的train_test_split()的参数含义解释
  6. torch.nn介绍
  7. nn.Sequential
  8. torch.nn.Conv2d()函数
  9. relu()激活函数、relu图像、其他相关函数
  10. nn.MaxPool2d()
  11. nn.Linear()全连接层
  12. x = x.view(x.size(0), -1)、Flatten
  13. nn.CrossEntropyLoss()
  14. torch.optim 优化器的使用
  15. torch的Module模块中named_parameters函数
  16. epoch
  17. torch的net.train() 与net.eval()
  18. enumerate(train_loader, start=0)函数的详解
  19. python __getitem__()方法理解(扩充)
  20. pytorch 损失函数及其应用代码详解、Pytorch十九种损失函数的使用、pytorch的nn.MSELoss损失函数
  21. loss.backward() 
  22. print()+end=""+\r实现滚动条显示
  23. torch.no_grad和验证模式
  24. (predicted == labels).sum().item()作用
  25. python基础之np.arange函数
  26. Pytorch查看模型参数并计算模型参数量与可训练参数量

导包


import torch
from sklearn import datasets #加载数据集用
from sklearn import model_selection #数据集切分
import torch.utils.data as Data #分批次loader数据集使用
import torch.nn as nn #神经网络API
import torch.optim as optim #神经网络优化器
import numpy as np #数字格式转换
import matplotlib.pyplot as plt #数据可视化

构建数据集


class train_mini_train():'''构建训练集'''def __init__(self):# 加载手写数字数据集digits,有标签,class为1~10self.X,self.y = \datasets.load_digits(return_X_y=True)print('样本总数:',len(self.X))print('样本特征维度:', len(self.X[0]))#数据集切分self.X_train,self.X_test,self.y_train,self.y_test = \model_selection.train_test_split(self.X,self.y,random_state=0)print('构建训练集样本总数:', len(self.y_train))def __len__(self):#返回训练集数据量return len(self.y_train)def __getitem__(self, index):return torch.tensor(self.X_train[index].reshape(1,8,8),dtype=torch.float32),self.y_train[index]class test_mini_test():'''构建测试集'''def __init__(self):self.X,self.y=datasets.load_digits(return_X_y=True)self.X_train,self.X_test,self.y_train,self.y_test =\model_selection.train_test_split(self.X,self.y,random_state=0)print('构建测试集样本总数:', len(self.y_test))def __getitem__(self, index):return torch.tensor(self.X_test[index].reshape(1,8,8),dtype=torch.float32),self.y_test[index]def __len__(self):return len(self.y_test)

神经网络结构


class SimpleNet(nn.Module):'''定义神经网络结构'''def __init__(self):super(SimpleNet,self).__init__()self.conv1 = nn.Sequential(#(1, 8, 8)nn.Conv2d(in_channels=1,out_channels=4,kernel_size=2,stride=1,padding=1), #(4, 8, 8))self.conv2 = nn.Sequential(nn.ReLU(), # (4, 8, 8))self.conv3 = nn.Sequential(nn.MaxPool2d(kernel_size=2) # (4,4,4) 不改变通道数)self.conv4 = nn.Sequential(nn.Conv2d(in_channels=4,out_channels=8,kernel_size=2,stride=1,padding=1), #(8,5,5))self.conv5 = nn.Sequential(nn.ReLU(), # (8,5,5))self.conv6 = nn.Sequential(nn.MaxPool2d(kernel_size=2) # (8,2,2))self.fc = nn.Linear(8*2*2,10) #(10)def forward(self, x):x = self.conv1(x)x = self.conv2(x)x = self.conv3(x)x = self.conv4(x)x = self.conv5(x)x = self.conv6(x)x = x.view(x.size(0),-1) #相当于Flattenx = self.fc(x)return x

训练测试精度可视化


def plot_train_and_test_result(train_accs,test_accs):epoches = np.arange(1,len(train_accs)+1,dtype=np.int32)plt.plot(epoches,train_accs,label='train accuracy')plt.plot(epoches,test_accs, label='test accuracy')plt.xlabel('epoches')plt.ylabel('accuracy')plt.legend()

计算模型精度


def eval_on_dataloader(name,loader,len):acc = 0.0with torch.no_grad():for data in loader:images,labels = dataoutputs = net(images)# torch.max返回两个数值,一个[0]是最大值,一个[1]是最大值的下标predict_y = torch.max(outputs,dim=1)[1]acc += (predict_y == labels.long()).sum().item()accurate = acc/lenreturn accurate

损失可视化


def plot_loss_result(losses):epoches = np.arange(1, len(losses) + 1, dtype=np.int32)plt.plot(epoches, losses, label='loss')plt.xlabel('epoches')plt.ylabel('loss')plt.legend()

输出网络结构信息


def printNetInfo(net):'''输出神经网络结构的信息'''for name,parameters in net.named_parameters():print(name,":",parameters.size())

训练神经网络



定义参数


batch_size = 6
learning_rate = 3e-3
epoches = 10

载入数据


#载入训练集与测试集数据train_data = train_mini_train()test_data = test_mini_test()train_loader = Data.DataLoader(dataset=train_data,batch_size=batch_size,shuffle=True)test_loader = Data.DataLoader(dataset=test_data,batch_size=batch_size,shuffle=True)

载入神经网络结构、损失及优化


#载入网络结构net = SimpleNet()# 声明损失函数及优化器loss_fn = nn.CrossEntropyLoss()optim = optim.Adam(params=net.parameters(),lr=learning_rate)# 输出网络结构信息# printNetInfo(net)

训练及测试


train_accs = []test_accs = []losses = []for epoch in range(epoches):net.train() # 训练for step,data in enumerate(train_loader,start=0):images,labels = dataoptim.zero_grad() # 优化器梯度清0logits = net(images) # 输入images 经过网络推断输出结果loss = loss_fn(logits,labels.long()) # 计算损失函数loss.backward() # 反向传播求梯度optim.step() #优化器进一步优化rate = (step+1)/len(train_loader)a = "*"*int(rate*50)b = "."*int((1-rate)*50)print("\repoch:%s train loss:%3.0f%%:%.4f"%(epoch,int(rate*100),loss),end=" ")losses.append(loss)net.eval() # 测试train_acc = eval_on_dataloader("train",train_loader,train_data.__len__())train_accs.append(train_acc)test_acc = eval_on_dataloader("test", test_loader, test_data.__len__())test_accs.append(test_acc)print("train_acc:", train_acc, " test_acc:", test_acc)

损失、精度可视化


#模型训练损失可视化plot_loss_result(losses)plt.show()#训练集与测试集精度可视化plot_train_and_test_result(train_accs,test_accs)plt.show()

question


  1. AttributeError: module ‘sklearn‘ has no attribute ‘datasets‘解决
  2. RuntimeError: Expected object of scalar type Long but got scalar type Int for argument #2 'target'

solution:data.long()数据类型转换


推荐阅读
  • 通过使用 `pandas` 库中的 `scatter_matrix` 函数,可以有效地绘制出多个特征之间的两两关系。该函数不仅能够生成散点图矩阵,还能通过参数如 `frame`、`alpha`、`c`、`figsize` 和 `ax` 等进行自定义设置,以满足不同的可视化需求。此外,`diagonal` 参数允许用户选择对角线上的图表类型,例如直方图或密度图,从而提供更多的数据洞察。 ... [详细]
  • Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]
  • python模块之正则
    re模块可以读懂你写的正则表达式根据你写的表达式去执行任务用re去操作正则正则表达式使用一些规则来检测一些字符串是否符合个人要求,从一段字符串中找到符合要求的内容。在 ... [详细]
  • 本文介绍如何使用OpenCV和线性支持向量机(SVM)模型来开发一个简单的人脸识别系统,特别关注在只有一个用户数据集时的处理方法。 ... [详细]
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • Python 序列图分割与可视化编程入门教程
    本文介绍了如何使用 Python 进行序列图的快速分割与可视化。通过一个实际案例,详细展示了从需求分析到代码实现的全过程。具体包括如何读取序列图数据、应用分割算法以及利用可视化库生成直观的图表,帮助非编程背景的用户也能轻松上手。 ... [详细]
  • 【图像分类实战】利用DenseNet在PyTorch中实现秃头识别
    本文详细介绍了如何使用DenseNet模型在PyTorch框架下实现秃头识别。首先,文章概述了项目所需的库和全局参数设置。接着,对图像进行预处理并读取数据集。随后,构建并配置DenseNet模型,设置训练和验证流程。最后,通过测试阶段验证模型性能,并提供了完整的代码实现。本文不仅涵盖了技术细节,还提供了实用的操作指南,适合初学者和有经验的研究人员参考。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 机器学习算法:SVM(支持向量机)
    SVM算法(SupportVectorMachine,支持向量机)的核心思想有2点:1、如果数据线性可分,那么基于最大间隔的方式来确定超平面,以确保全局最优, ... [详细]
  • 本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节,作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识,为后续的机器学习应用打下坚实的基础。 ... [详细]
  • 探讨Redis的最佳应用场景
    本文将深入探讨Redis在不同场景下的最佳应用,包括其优势和适用范围。 ... [详细]
  • 利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Exce ... [详细]
  • JComponentJLabel的setBorder前言用例2205262241前言setBorder(Border边框)实现自JComponentjava.awt.Insets ... [详细]
  • poj 3352 Road Construction ... [详细]
  • 如何将Python与Excel高效结合:常用操作技巧解析
    本文深入探讨了如何将Python与Excel高效结合,涵盖了一系列实用的操作技巧。文章内容详尽,步骤清晰,注重细节处理,旨在帮助读者掌握Python与Excel之间的无缝对接方法,提升数据处理效率。 ... [详细]
author-avatar
文静的疯子19__97
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有