LeNet识别手写数字图像的经典卷积神经网络与PyTorch实现

作者：徐成奕_98743 | 来源：互联网 | 2023-09-13 11:45

LeNet------识别手写数字图像的经典卷积神经网络与PyTorch实现1、LeNet简介1.1卷积模块1.2全连接模块2、LeNet主要贡献3、LeNet网络结构PyTorc

LeNet------识别手写数字图像的经典卷积神经网络与PyTorch实现

- 1、LeNet简介
- - 1.1 卷积模块
  - 1.2 全连接模块
- 2、LeNet主要贡献
- 3、LeNet网络结构PyTorch实现

1、LeNet简介

LeNet的网络结构如下图所示。
在这里插入图片描述
由上图可以看出&＃xff0c;LeNet模型主要有两部分组成&＃xff1a;卷积模块&＃xff08;红色区域&＃xff09;与全连接模块&＃xff08;绿色区域&＃xff09;。而在卷积模块中主要是由卷积操作与最大池化层。

1.1 卷积模块

在卷积层块中&＃xff0c;每个卷积层都使用 $5×55\times 5$ 的窗口&＃xff0c;并在输出上使用sigmoid激活函数。第一个卷积层输出通道数为6&＃xff0c;第二个卷积层输出通道数则增加到16。
在上图网络结构中有Subsampling&＃xff0c;此过程就是应用最大池化完成的。其中&＃xff0c;最大池化的窗口大小为 $2×22\times 2$ &＃xff0c;且步幅为2。由于池化窗口与步幅形状相同&＃xff0c;池化窗口在输入上每次滑动所覆盖的区域互不重叠。

1.2 全连接模块

全连接模块是以第二次卷积池化的结果作为输入。此时的输出主要包括批量大小, 通道, 高, 宽等4维数据。当卷积层块的输出传入全连接层块时&＃xff0c;全连接层的输入形状将变成二维&＃xff08;flatten操作&＃xff0c;即将小批量中每个样本变平化&＃xff09;&＃xff0c;其中第一维是小批量中的样本&＃xff0c;第二维是每个样本变平后的向量表示&＃xff0c;且向量长度为通道、高和宽的乘积。全连接层块含3个全连接层。它们的输出个数分别是120、84和10&＃xff0c;其中10为输出的类别个数。

2、LeNet主要贡献

LeNet是第一次将卷积神经网络应用于实际操作中&＃xff0c;是通过梯度下降训练卷积神经网络的鼻祖算法之一&＃xff1b;
LeNet奠定了卷积神经网络的基本结构&＃xff0c;即卷积、非线性激活函数、池化、全连接&＃xff1b;
使用局部感受野&＃xff0c;权值共享&＃xff0c;池化&＃xff08;下采样&＃xff09;来实现图像的平移&＃xff0c;缩放和形变的不变性&＃xff0c;其中卷积层用来识别图像里的空间模式&＃xff0c;如线条和物体局部特征&＃xff0c;最大池化层则用来降低卷积层对位置的敏感性&＃xff1b;

3、LeNet网络结构PyTorch实现

import time import torch from torch import nn, optim device &＃61; torch.device(&＃39;cuda&＃39; if torch.cuda.is_available() else &＃39;cpu&＃39;)class LeNet(nn.Module):def __init__(self):super(LeNet, self).__init__()self.conv &＃61; nn.Sequential(nn.Conv2d(1, 6, 5), # 通过5*5卷积将1通道转为6通道nn.Sigmoid(), # 使用非线性激活函数nn.MaxPool2d(2, 2), # 大小2*2&＃xff0c;步长为2nn.Conv2d(6, 16, 5), # 通过5*5卷积将6通道转为16通道nn.Sigmoid(),nn.MaxPool2d(2, 2))self.fc &＃61; nn.Sequential(nn.Linear(16*4*4, 120), # flatten操作nn.Sigmoid(),nn.Linear(120, 84),nn.Sigmoid(),nn.Linear(84, 10))def forward(self, img):feature &＃61; self.conv(img)output &＃61; self.fc(feature.view(img.shape[0], -1))return output

推荐阅读

view
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
view
pytorch(一)：torch构建数据集并训练一个神经网络

目录预备知识导包构建数据集神经网络结构训练测试精度可视化计算模型精度损失可视化输出网络结构信息训练神经网络定义参数载入数据载入神经网络结构、损失及优化训练及测试损失、精度可视化qu ... [详细]

蜡笔小新 2024-11-14 13:06:38
view
PyTorch实用技巧汇总（持续更新中）

空洞卷积（Dilated Convolutions）在卷积操作中通过在卷积核元素之间插入空格来扩大感受野，这一过程由超参数 dilation rate 控制。这种技术在保持参数数量不变的情况下，能够有效地捕捉更大范围的上下文信息，适用于多种视觉任务，如图像分割和目标检测。本文将详细介绍空洞卷积的计算原理及其应用场景。 ... [详细]

蜡笔小新 2024-11-11 12:16:55
view
从零开始掌握PyTorch：生成对抗网络GAN进阶指南（第九篇）

本文将深入探讨生成对抗网络（GAN）在计算机视觉领域的应用。作为该领域的经典模型，GAN通过生成器和判别器的对抗训练，能够高效地生成高质量的图像。本文不仅回顾了GAN的基本原理，还将介绍一些最新的进展和技术优化方法，帮助读者全面掌握这一重要工具。 ... [详细]

蜡笔小新 2024-11-02 13:18:42
js
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
js
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
list
【图像分类实战】利用DenseNet在PyTorch中实现秃头识别

本文详细介绍了如何使用DenseNet模型在PyTorch框架下实现秃头识别。首先，文章概述了项目所需的库和全局参数设置。接着，对图像进行预处理并读取数据集。随后，构建并配置DenseNet模型，设置训练和验证流程。最后，通过测试阶段验证模型性能，并提供了完整的代码实现。本文不仅涵盖了技术细节，还提供了实用的操作指南，适合初学者和有经验的研究人员参考。 ... [详细]

蜡笔小新 2024-11-06 15:21:35
list
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
list
深度森林算法解析：特征选择与确定能力分析

本文深入探讨了深度森林算法在特征选择与确定方面的能力。提出了一种名为EncoderForest（简称eForest）的创新方法，作为首个基于决策树的编码器模型，它在处理高维数据时展现出卓越的性能，为特征选择提供了新的视角和工具。 ... [详细]

蜡笔小新 2024-10-29 18:09:45
list
2019年斯坦福大学CS224n课程笔记：深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析

本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理（NLP）领域的应用，重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析，深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]

蜡笔小新 2024-10-29 10:37:07
list
不用蘑菇，不拾金币，我通过强化学习成功通关29关马里奥，创造全新纪录

《超级马里奥兄弟》由任天堂于1985年首次发布，是一款经典的横版过关游戏，至今已在多个平台上售出超过5亿套。该游戏不仅勾起了许多玩家的童年回忆，也成为强化学习领域的热门研究对象。近日，通过先进的强化学习技术，研究人员成功让AI通关了29关，创造了新的纪录。这一成就不仅展示了强化学习在游戏领域的潜力，也为未来的人工智能应用提供了宝贵的经验。 ... [详细]

蜡笔小新 2024-10-28 10:11:47
list
PyTorch常见预训练模型的下载链接及使用指南

本文提供了PyTorch框架中常用的预训练模型的下载链接及详细使用指南，涵盖ResNet、Inception、DenseNet、AlexNet、VGGNet等六大分类模型。每种模型的预训练参数均经过精心调优，适用于多种计算机视觉任务。文章不仅介绍了模型的下载方式，还详细说明了如何在实际项目中高效地加载和使用这些模型，为开发者提供全面的技术支持。 ... [详细]

蜡笔小新 2024-10-27 13:57:42
list
利用 PyTorch 实现 Python 中的高效矩阵运算

利用 PyTorch 实现 Python 中的高效矩阵运算 ... [详细]

蜡笔小新 2024-10-26 20:00:47
list
YOLO V3 Pytorch 实战教程 Part 4：深入解析置信度阈值与非极大值抑制技术

在上一节中，我们完成了网络的前向传播实现。本节将重点探讨如何为检测输出设定目标置信度阈值，并应用非极大值抑制技术以提高检测精度。为了更好地理解和实践这些内容，建议读者已经完成本系列教程的前三部分，并具备一定的PyTorch基础知识。此外，我们将详细介绍这些技术的原理及其在实际应用中的重要性，帮助读者深入理解目标检测算法的核心机制。 ... [详细]

蜡笔小新 2024-10-26 14:31:07
js
SoundPool

如果应用程序经常播放密集、急促而又短暂的音效（如游戏音效）那么使用MediaPlayer显得有些不太适合了。因为MediaPlayer存在如下缺点：1)延时时间较长，且资源占用率高 ... [详细]

蜡笔小新 2024-11-13 16:47:19

徐成奕_98743

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章