AlexNet基于MNIST数据集的代码实现

作者：捕鱼达人2602917825 | 来源：互联网 | 2023-09-18 13:50

AlexNet基于MNIST数据集的代码实现鉴于原论文中使用的数据集过于庞大，分类过多，目前手头的设备运行是在过于缓慢，折中考虑尝试使用

鉴于原论文中使用的数据集过于庞大&＃xff0c;分类过多&＃xff0c;目前手头的设备运行是在过于缓慢&＃xff0c;折中考虑尝试使用MNIST的数据集实现AlexNet

import torch, torchvision import torchvision.transforms as transforms import torch.nn as nn from torch import optim import matplotlib.pyplot as plt %matplotlib inline import copy

# 超参数设置 EPOCH &＃61; 10 BATCH_SIZE &＃61; 64 LR &＃61; 0.01

transform &＃61; transforms.ToTensor()

数据集

通过torchvision下载数据集

trainset &＃61; torchvision.datasets.MNIST(root&＃61;&＃39;../data&＃39;, train&＃61;True, download&＃61;True, transform&＃61;transform)testset &＃61; torchvision.datasets.MNIST(root&＃61;&＃39;../data&＃39;, train&＃61;True, transform&＃61;transform)

C:\Users\Administrator\AppData\Roaming\Python\Python36\site-packages\torchvision\datasets\mnist.py:498: UserWarning: The given NumPy array is not writeable, and PyTorch does not support non-writeable tensors. This means you can write to the underlying (supposedly non-writeable) NumPy array using the tensor. You may want to copy the array to protect its data or make it writeable before converting it to a tensor. This type of warning will be suppressed for the rest of this program. (Triggered internally at ..\torch\csrc\utils\tensor_numpy.cpp:180.)return torch.from_numpy(parsed.astype(m[2], copy&＃61;False)).view(*s)

trainloader &＃61; torch.utils.data.DataLoader(trainset, batch_size&＃61;BATCH_SIZE, shuffle&＃61;True)testloader &＃61; torch.utils.data.DataLoader(testset, batch_size&＃61;BATCH_SIZE, shuffle&＃61;False)

绘图查看

plt.imshow(trainset[4][0][0], cmap&＃61;&＃39;gray&＃39;)

请添加图片描述

查看数据格式

trainset[0][0].shape

torch.Size([1, 28, 28])

为了通用&＃xff0c;设置一个device&＃xff0c;如果有显卡并配置好了cuda环境&＃xff0c;那么就选择为cuda&＃xff0c;否则为cpu

device &＃61; torch.device(&＃39;cuda&＃39; if torch.cuda.is_available() else &＃39;cpu&＃39;) device

device(type&＃61;&＃39;cpu&＃39;)

AlexNet

同样地&＃xff0c;仿照AlexNet&＃xff0c;设置了五个卷积层和三个全连接层构建一个深度卷积神经网络&＃xff0c;网络的定义是重写nn.Module实现的&＃xff0c;卷积层和全连接层之间将数据通过view拉平^[1]

class AlexNet(nn.Module):def __init__(self,width_mult&＃61;1):super(AlexNet, self).__init__()self.layer1 &＃61; nn.Sequential(nn.Conv2d(1, 32, kernel_size&＃61;3, padding&＃61;1), # 32*28*28nn.MaxPool2d(kernel_size&＃61;2, stride&＃61;2), # 32*14*14nn.ReLU(inplace&＃61;True),)self.layer2 &＃61; nn.Sequential(nn.Conv2d(32, 64, kernel_size&＃61;3, padding&＃61;1), # 64*14*14nn.MaxPool2d(kernel_size&＃61;2, stride&＃61;2), # 64*7*7nn.ReLU(inplace&＃61;True),)self.layer3 &＃61; nn.Sequential(nn.Conv2d(64, 128, kernel_size&＃61;3, padding&＃61;1), # 128*7*7)self.layer4 &＃61; nn.Sequential(nn.Conv2d(128, 256, kernel_size&＃61;3, padding&＃61;1), # 256*7*7)self.layer5 &＃61; nn.Sequential(nn.Conv2d(256, 256, kernel_size&＃61;3, padding&＃61;1), # 256*7*7nn.MaxPool2d(kernel_size&＃61;3, stride&＃61;2), # 256*3*3nn.ReLU(inplace&＃61;True),)self.fc1 &＃61; nn.Linear(256*3*3, 1024)self.fc2 &＃61; nn.Linear(1024, 512)self.fc3 &＃61; nn.Linear(512, 10)def forward(self, x):x &＃61; self.layer1(x)x &＃61; self.layer2(x)x &＃61; self.layer3(x)x &＃61; self.layer4(x)x &＃61; self.layer5(x)x &＃61; x.view(-1, 256*3*3)x &＃61; self.fc1(x)x &＃61; self.fc2(x)x &＃61; self.fc3(x)return x

设置超参数

EPOCH &＃61; 5 BATCH_SIZE &＃61; 128 LR &＃61; 0.01

def validate(model, data):total &＃61; 0correct &＃61; 0for i, (images, labels) in enumerate(data):images &＃61; images.to(device)x &＃61; net(images)value, pred &＃61; torch.max(x,1)pred &＃61; pred.data.cpu()total &＃43;&＃61; x.size(0)correct &＃43;&＃61; torch.sum(pred &＃61;&＃61; labels)return correct*100./total

初始化模型并将模型放到device上&＃xff0c;如果有显卡就在cuda上&＃xff0c;如果没有&＃xff0c;那么在cpu

如果是纯cpu训练&＃xff0c;速度十分感人

net &＃61; AlexNet().to(device)

# alexnet训练 def train():# 定义损失函数为交叉熵损失&＃xff0c;优化方法为SGDcriterion &＃61; nn.CrossEntropyLoss() optimizer &＃61; optim.SGD(net.parameters(), lr&＃61;LR, momentum&＃61;0.9)max_accuracy&＃61;0accuracies&＃61;[]for epoch in range(EPOCH):for i, (images,labels) in enumerate(trainloader):images &＃61; images.to(device)labels &＃61; labels.to(device)optimizer.zero_grad()outputs &＃61; net(images)loss &＃61; criterion(outputs, labels)loss_item &＃61; loss.item()loss.backward()optimizer.step()accuracy &＃61; float(validate(criterion, testloader))accuracies.append(accuracy)print("Epoch %d accuracy: %f loss: %f" % (epoch, accuracy, loss_item))if accuracy > max_accuracy:best_model &＃61; copy.deepcopy(criterion)max_accuracy &＃61; accuracyprint("Saving Best Model with Accuracy: ", accuracy)print(&＃39;Epoch:&＃39;, epoch&＃43;1, "Accuracy :", accuracy, &＃39;%&＃39;)plt.plot(accuracies)return best_model

这一行代码是调用之前的train函数训练神经网络&＃xff0c;初始化设置的epoch是5&＃xff0c;大概也可以训练一个准确度较高的模型

alexnet &＃61; train()

为了防止断点或者bug导致jupyter重启之后重新训练模型&＃xff0c;这一点经常遇到&＃xff0c;本代码是在google的colab上训练的&＃xff0c;为了保存训练的结果&＃xff0c;还是将模型保存为pkl文件&＃xff0c;这样本地就不用训练&＃xff0c;直接调用训练之后的模型&＃xff0c;之前尝试直接保存整个模型&＃xff0c;但是会有莫名其妙的bug&＃xff0c;暂时没有解决。这里尝试了另一种保存模型的方式^[2]&＃xff0c;直接保存模型的参数&＃xff0c;然后将参数传递到初始化的模型架构中&＃xff0c;如下所示&＃xff1a;

# 保存模型参数 torch.save(alexnet, &＃39;../models/alexnet.pkl&＃39;)

# 加载模型 alexnet &＃61; AlexNet() alexnet.load_state_dict(torch.load(&＃39;../models/alexnet.pkl&＃39;))

AlexNet((layer1): Sequential((0): Conv2d(1, 32, kernel_size&＃61;(3, 3), stride&＃61;(1, 1), padding&＃61;(1, 1))(1): MaxPool2d(kernel_size&＃61;2, stride&＃61;2, padding&＃61;0, dilation&＃61;1, ceil_mode&＃61;False)(2): ReLU(inplace&＃61;True))(layer2): Sequential((0): Conv2d(32, 64, kernel_size&＃61;(3, 3), stride&＃61;(1, 1), padding&＃61;(1, 1))(1): MaxPool2d(kernel_size&＃61;2, stride&＃61;2, padding&＃61;0, dilation&＃61;1, ceil_mode&＃61;False)(2): ReLU(inplace&＃61;True))(layer3): Sequential((0): Conv2d(64, 128, kernel_size&＃61;(3, 3), stride&＃61;(1, 1), padding&＃61;(1, 1)))(layer4): Sequential((0): Conv2d(128, 256, kernel_size&＃61;(3, 3), stride&＃61;(1, 1), padding&＃61;(1, 1)))(layer5): Sequential((0): Conv2d(256, 256, kernel_size&＃61;(3, 3), stride&＃61;(1, 1), padding&＃61;(1, 1))(1): MaxPool2d(kernel_size&＃61;3, stride&＃61;2, padding&＃61;0, dilation&＃61;1, ceil_mode&＃61;False)(2): ReLU(inplace&＃61;True))(fc1): Linear(in_features&＃61;2304, out_features&＃61;1024, bias&＃61;True)(fc2): Linear(in_features&＃61;1024, out_features&＃61;512, bias&＃61;True)(fc3): Linear(in_features&＃61;512, out_features&＃61;10, bias&＃61;True) )

为直观的查看效果&＃xff0c;选择一组测试集图片查看分类效果

plt.figure(figsize&＃61;(14, 14)) for i, (image, label) in enumerate(testloader):predict &＃61; torch.argmax(alexnet(image), axis&＃61;1)print((predict &＃61;&＃61; label).sum()/label.shape[0])for j in range(image.shape[0]):plt.subplot(8, 8, j&＃43;1)plt.imshow(image[j, 0], cmap&＃61;&＃39;gray&＃39;)plt.title(predict[j].item())plt.axis(&＃39;off&＃39;)if i&＃61;&＃61;1:break

tensor(1.)

请添加图片描述

参考文献

[1] Sowndharya206/alexnet

[2] SAVE AND LOAD THE MODEL

推荐阅读

python
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新 2024-11-14 13:06:38
io
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
python
【图像分类实战】利用DenseNet在PyTorch中实现秃头识别

本文详细介绍了如何使用DenseNet模型在PyTorch框架下实现秃头识别。首先，文章概述了项目所需的库和全局参数设置。接着，对图像进行预处理并读取数据集。随后，构建并配置DenseNet模型，设置训练和验证流程。最后，通过测试阶段验证模型性能，并提供了完整的代码实现。本文不仅涵盖了技术细节，还提供了实用的操作指南，适合初学者和有经验的研究人员参考。 ... [详细]

蜡笔小新 2024-11-06 15:21:35
blob
探索聚类分析中的K-Means与DBSCAN算法及其应用

聚类分析是一种用于解决样本或特征分类问题的统计分析方法，也是数据挖掘领域的重要算法之一。本文主要探讨了K-Means和DBSCAN两种聚类算法的原理及其应用场景。K-Means算法通过迭代优化簇中心来实现数据点的划分，适用于球形分布的数据集；而DBSCAN算法则基于密度进行聚类，能够有效识别任意形状的簇，并且对噪声数据具有较好的鲁棒性。通过对这两种算法的对比分析，本文旨在为实际应用中选择合适的聚类方法提供参考。 ... [详细]

蜡笔小新 2024-11-04 13:20:39
python
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
io
Vision Transformer (ViT) 和 DETR 深度解析

本文详细介绍了 Vision Transformer (ViT) 和 DETR 的工作原理，并提供了相关的代码实现和参考资料。通过观看教学视频和阅读博客，对 ViT 的全流程进行了详细的笔记整理，包括代码详解和关键概念的解释。 ... [详细]

蜡笔小新 2024-11-12 20:32:38
io
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
io
Spring详解（六）AOP

原文网址：https:www.cnblogs.comysoceanp7476379.html目录1、AOP什么？2、需求3、解决办法1:使用静态代理4 ... [详细]

蜡笔小新 2024-11-12 14:40:40
io
实验九：使用SharedPreferences存储简单数据

本实验旨在帮助学生理解和掌握使用SharedPreferences存储和读取简单数据的方法，包括程序参数和用户选项。 ... [详细]

蜡笔小新 2024-11-12 14:21:47
io
字节流(InputStream和OutputStream)，字节流读写文件，字节流的缓冲区，字节缓冲流

字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream，所有的输出流都继承子OutputStreamInput ... [详细]

蜡笔小新 2024-11-12 14:07:25
io
JavaAwtSwing笔记之 JComponent JLabel 的 setBorder(Border 边框) 用例

JComponentJLabel的setBorder前言用例2205262241前言setBorder(Border边框)实现自JComponentjava.awt.Insets ... [详细]

蜡笔小新 2024-11-12 13:48:19
io
开发技巧：在Interface Builder中实现UIButton文本居中对齐的方法与步骤

开发技巧：在Interface Builder中实现UIButton文本居中对齐的方法与步骤 ... [详细]

蜡笔小新 2024-11-11 17:13:04
io
Java项目中两个文件互相调用时出现函数错误，请求专业解决方案

在Java项目中，当两个文件进行互相调用时出现了函数错误。具体问题出现在 `MainFrame.java` 文件中，该文件位于 `cn.javass.bookmgr` 包下，并且导入了 `java.awt.BorderLayout` 和 `java.awt.Event` 等相关类。为了确保项目的正常运行，请求提供专业的解决方案，以解决函数调用中的错误。建议从类路径、依赖关系和方法签名等方面入手，进行全面排查和调试。 ... [详细]

蜡笔小新 2024-11-08 17:04:11
io
图像分类训练方案优化设计

针对图像分类任务的训练方案进行了优化设计。通过引入PyTorch等深度学习框架，利用其丰富的工具包和模块，如 `torch.nn` 和 `torch.nn.functional`，提升了模型的训练效率和分类准确性。优化方案包括数据预处理、模型架构选择和损失函数的设计等方面，旨在提高图像分类任务的整体性能。 ... [详细]

蜡笔小新 2024-11-07 16:45:46
replace
利用GLSL在iOS上实现YV12到RGB的转换，并附带展示结果图像

本文介绍了如何在iOS平台上使用GLSL着色器将YV12格式的视频帧数据转换为RGB格式，并展示了转换后的图像效果。通过详细的技术实现步骤和代码示例，读者可以轻松掌握这一过程，适用于需要进行视频处理的应用开发。 ... [详细]

蜡笔小新 2024-11-06 19:18:22

捕鱼达人2602917825

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章