当前位置: 开发笔记 > 编程语言 > 正文

Pytorch入门实战（2）使用BP神经网络实现MNIST手写数字识别

作者：鱼儿没有水会死_543 | 来源：互联网 | 2023-08-04 21:25

代码地址上一篇：Pytorch入门实战（1）-实现线性回归涉及知识点Pytorchnn.Module的基本使用Pytorchnn.

代码地址

上一篇&＃xff1a;Pytorch入门实战&＃xff08;1&＃xff09; - 实现线性回归

涉及知识点

Pytorch nn.Module的基本使用

Pytorch nn.Linear的基本用法

PytorchVision Transforms的基本使用

Pytorch中DataLoader的基本用法

Pytorch详解NLLLoss和CrossEntropyLoss

如何确定神经网络的层数和隐藏层神经元数量

本文内容

本文将会使用BP神经网络&＃xff08;就是最普通的神经网络&＃xff09;实现一个MNIST手写数据集的实现。话不多说&＃xff0c;直接开始。

首先先导入需要的包:

import os import numpy as np import torch import torchvision import matplotlib.pyplot as plt from time import time from torchvision import datasets, transforms from torch import nn, optim

定义transform对象&＃xff0c;其定义了数据集中的图片应该做怎样的处理&＃xff1a;

transform &＃61; transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.5,), (0.5,)),])

加载和下载训练数据集&＃xff0c;这里使用pytorch提供的API进行下载&＃xff1a;

train_set &＃61; datasets.MNIST(&＃39;train_set&＃39;, # 下载到该文件夹下download&＃61;not os.path.exists(&＃39;train_set&＃39;), # 是否下载&＃xff0c;如果下载过&＃xff0c;则不重复下载train&＃61;True, # 是否为训练集transform&＃61;transform # 要对图片做的transform) train_set

Dataset MNISTNumber of datapoints: 60000Root location: train_setSplit: TrainStandardTransform Transform: Compose(ToTensor()Normalize(mean&＃61;(0.5,), std&＃61;(0.5,)))

等待一段时间下载成功后&＃xff0c;可以看到训练集中一共有6w个数据&＃xff0c;接下来下载测试数据集&＃xff1a;

test_set &＃61; datasets.MNIST(&＃39;test_set&＃39;, download&＃61;not os.path.exists(&＃39;test_set&＃39;),train&＃61;False, transform&＃61;transform) test_set

Dataset MNISTNumber of datapoints: 10000Root location: test_setSplit: TestStandardTransform Transform: Compose(ToTensor()Normalize(mean&＃61;(0.5,), std&＃61;(0.5,)))

测试数据集包含1w条数据

接下来构建训练数据集和测试数据集的DataLoader对象&＃xff1a;

train_loader &＃61; torch.utils.data.DataLoader(train_set, batch_size&＃61;64, shuffle&＃61;True) test_loader &＃61; torch.utils.data.DataLoader(test_set, batch_size&＃61;64, shuffle&＃61;True)dataiter &＃61; iter(train_loader) images, labels &＃61; dataiter.next()print(images.shape) print(labels.shape)

torch.Size([64, 1, 28, 28]) torch.Size([64])

在上面&＃xff0c;我们将其分成64个一组的图片&＃xff0c;每个图片只有一个通道&＃xff08;灰度图&＃xff09;&＃xff0c;大小为28x28。抽一张绘制一下&＃xff1a;

plt.imshow(images[0].numpy().squeeze(), cmap&＃61;&＃39;gray_r&＃39;);

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-y9mFdvWM-1644145945684)(output_16_0.png)]

到这里&＃xff0c;前期准备工作就结束了。

开始定义神经网络

class NerualNetwork(nn.Module):def __init__(self):super().__init__()"""定义第一个线性层&＃xff0c;输入为图片&＃xff08;28x28&＃xff09;&＃xff0c;输出为第一个隐层的输入&＃xff0c;大小为128。"""self.linear1 &＃61; nn.Linear(28 * 28, 128)# 在第一个隐层使用ReLU激活函数self.relu1 &＃61; nn.ReLU()"""定义第二个线性层&＃xff0c;输入是第一个隐层的输出&＃xff0c;输出为第二个隐层的输入&＃xff0c;大小为64。"""self.linear2 &＃61; nn.Linear(128, 64)# 在第二个隐层使用ReLU激活函数self.relu2 &＃61; nn.ReLU()"""定义第三个线性层&＃xff0c;输入是第二个隐层的输出&＃xff0c;输出为输出层&＃xff0c;大小为10"""self.linear3 &＃61; nn.Linear(64, 10)# 最终的输出经过softmax进行归一化self.softmax &＃61; nn.LogSoftmax(dim&＃61;1)# 上述动作可以直接使用nn.Sequential写成如下形式&＃xff1a;self.model &＃61; nn.Sequential(nn.Linear(28 * 28, 128),nn.ReLU(),nn.Linear(128, 64),nn.ReLU(),nn.Linear(64, 10),nn.LogSoftmax(dim&＃61;1))def forward(self, x):"""定义神经网络的前向传播x: 图片数据, shape为(64, 1, 28, 28)"""# 首先将x的shape转为(64, 784)x &＃61; x.view(x.shape[0], -1)# 接下来进行前向传播x &＃61; self.linear1(x)x &＃61; self.relu1(x)x &＃61; self.linear2(x)x &＃61; self.relu2(x)x &＃61; self.linear3(x)x &＃61; self.softmax(x)# 上述一串&＃xff0c;可以直接使用 x &＃61; self.model(x) 代替。return x

model &＃61; NerualNetwork()

神经网络定义完后&＃xff0c;开始定义损失函数&＃xff0c;这里选用负对数似然损失函数&＃xff08;NLLLoss&＃xff0c; negative log likelihood loss&＃xff09;&＃xff0c;其常用于分类任务。详情可参考链接

criterion &＃61; nn.NLLLoss()

接下来定义优化器&＃xff0c;这里使用随机梯度下降法&＃xff0c;学习率设置为0.003&＃xff0c;momentum取默认的0.9&＃xff08;用于防止过拟合&＃xff09;

optimizer &＃61; optim.SGD(model.parameters(), lr&＃61;0.003, momentum&＃61;0.9)

准备工作完毕&＃xff0c;开始训练数据集&＃xff1a;

time0 &＃61; time() # 记录下当前时间 epochs &＃61; 15 # 一共训练15轮 for e in range(epochs):running_loss &＃61; 0 # 本轮的损失值for images, labels in train_loader:# 前向传播获取预测值output &＃61; model(images) # 计算损失loss &＃61; criterion(output, labels) # 进行反向传播loss.backward()# 更新权重optimizer.step()# 清空梯度optimizer.zero_grad() # 累加损失running_loss &＃43;&＃61; loss.item()else:# 一轮循环结束后打印本轮的损失函数print("Epoch {} - Training loss: {}".format(e, running_loss/len(train_loader)))# 打印总的训练时间 print("\nTraining Time (in minutes) &＃61;",(time()-time0)/60)

Epoch 0 - Training loss: 0.6462286284117937 Epoch 1 - Training loss: 0.27847810615418056 Epoch 2 - Training loss: 0.21768317640081905 Epoch 3 - Training loss: 0.17949896098088736 Epoch 4 - Training loss: 0.1514430489978874 Epoch 5 - Training loss: 0.12892813527329103 Epoch 6 - Training loss: 0.11302738852882341 Epoch 7 - Training loss: 0.09980541475113235 Epoch 8 - Training loss: 0.08899609394905679 Epoch 9 - Training loss: 0.0805584444001174 Epoch 10 - Training loss: 0.07290568387211323 Epoch 11 - Training loss: 0.06743549962075296 Epoch 12 - Training loss: 0.06314737589380491 Epoch 13 - Training loss: 0.056689855163551565 Epoch 14 - Training loss: 0.05361823974547586Training Time (in minutes) &＃61; 2.9436919848124186

最终在我这台机器上&＃xff0c;花费了2分多钟完成了训练。可以看到&＃xff0c;损失是越来越小的。

接下来进行模型的评估

correct_count, all_count &＃61; 0, 0 model.eval() # 将模型设置为评估模式# 从test_loader中一批一批加载图片 for images,labels in test_loader:# 循环检测这一批图片for i in range(len(labels)):logps &＃61; model(images[i]) # 进行前向传播&＃xff0c;获取预测值probab &＃61; list(logps.detach().numpy()[0]) # 将预测结果转为概率列表。[0]是取第一张照片的10个数字的概率列表&＃xff08;因为一次只预测一张照片&＃xff09;pred_label &＃61; probab.index(max(probab)) # 取最大的index作为预测结果true_label &＃61; labels.numpy()[i]if(true_label &＃61;&＃61; pred_label): # 判断是否预测正确correct_count &＃43;&＃61; 1all_count &＃43;&＃61; 1print("Number Of Images Tested &＃61;", all_count) print("\nModel Accuracy &＃61;", (correct_count/all_count))

Number Of Images Tested &＃61; 10000Model Accuracy &＃61; 0.9741

最终&＃xff0c;本次训练在测试数据集上的精准率为97.41%

参考资料

Handwritten Digit Recognition Using PyTorch — Intro To Neural Networks&＃xff1a; https://towardsdatascience.com/handwritten-digit-mnist-pytorch-977b5338e627

推荐阅读

sum
文本生成图像简要回顾 text to image synthesis

摘要文本生成图像作为近几年的热门研究领域，其解决的问题是从一句描述性文本生成与之对应的图片。近一周来，我通过阅读了近几年发表于顶会的近10篇论文，做出本文中对该方向的 ... [详细]

蜡笔小新 2024-09-29 11:02:00
sum
Android Studio 使用BottomNavigationView 实现底部 tabs (一)

一、在androidStudio中实现tabs比较简单，新建项目就可以选择tabs模板进行创建，默认实现tabs功能：直接运行项目就可以看到效果：可以说非常简单，但是我们在实际开发 ... [详细]

蜡笔小新 2024-09-28 19:42:55
format
vcharts的那些坑

每次用到v-charts我都一阵头疼，因为明明是相同的功能，但是我好像每次用到的解决方法都不一样？？每次都是在api中各种查，各种尝试…直到做了个各种数据图形的需求，决定还是好好整 ... [详细]

蜡笔小新 2024-09-26 15:35:07
sum
大数据基础复习大三上

1.Python1.数据类型1.数字整形:int浮点型:float复数型：complex布尔型:bool2.字符串字符串：String3.与 ... [详细]

蜡笔小新 2024-09-26 12:44:43
sum
python绘图设置正交坐标等距_Python:线性代数机器学习背后的优化原理 (五十五)...

线性代数：机器学习背后的优化原理线性代数作为数学的一个分支，广泛应用于科学和工程中，掌握好线性代数对于理解和从事机器学习算法相关工作是很有 ... [详细]

蜡笔小新 2024-09-26 10:09:12
sum
深度强化学习Policy Gradient基本实现

全文共2543个字，2张图，预计阅读时间15分钟。基于值的强化学习算法的基本思想是根据当前的状态，计算采取每个动作的价值，然 ... [详细]

蜡笔小新 2024-09-25 17:01:10
function
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
sum
开发笔记:Xunit测试使用个人小结

篇首语：本文由编程笔记#小编为大家整理，主要介绍了Xunit测试使用个人小结相关的知识，希望对你有一定的参考价值。因工作中用到xunit测试，故总结下用法，以供个人参考使 ... [详细]

蜡笔小新 2024-09-29 10:56:48
metadata
org.assertj.core.api.AbstractCharSequenceAssert.hasSize()方法的使用及代码示例

本文整理了Java中org.assertj.core.api.AbstractCharSequenceAssert.hasSize()方法的一些代码示例，展示了 ... [详细]

蜡笔小新 2024-09-28 10:08:14
metadata
TLB 缓存延迟刷新漏洞 CVE201818281 解析

TLB 缓存延迟刷新漏洞 CVE201818281 解析 ... [详细]

蜡笔小新 2024-09-27 17:53:48
数组
漫画：位运算系列篇（只出现一次的数字）

今天是小浩算法“365刷题计划”第62天。仍然分享一道关于位运算颇为简单的题型，同时，从明天开始将会提高难度，大家做好准备。01PARTS ... [详细]

蜡笔小新 2024-09-27 15:07:38
utf-8
python 英文关键词提取_如何提取文章的关键词（Python版）

项目需求：我们采集来的文章没有关键词，在发布的时候无法设定标签，我们通过代码自动提取出文章的关键词，达到对数据加工的目的。 ... [详细]

蜡笔小新 2024-09-26 10:32:12
utf-8
iOS 获取变量属性：修改UIAlertController样式

iOS8之后系统把UIActionSheet和UIAlertView合并为了UIAlertController,使用就不比多说了,但在使用的过程中发现样式是固定的，点 ... [详细]

蜡笔小新 2024-09-26 10:11:40
web
响应式页面的概述和实现方式

本文介绍了响应式页面的概念和实现方式，包括针对不同终端制作特定页面和制作一个页面适应不同终端的显示。分析了两种实现方式的优缺点，提出了选择方案的建议。同时，对于响应式页面的需求和背景进行了讨论，解释了为什么需要响应式页面。 ... [详细]

蜡笔小新 2023-12-11 12:37:10
web
Smrti Lab 和 ArkStream Demo Day 10 个参展新项目一览

元宇宙、跨链桥、NFT交易市场、期权产品服务商、Layer1、DID、Web3基础设施等领域的被投项目参与路演。 ... [详细]

蜡笔小新 2023-10-17 13:02:21

鱼儿没有水会死_543

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章