经典CNN模型之AlexNet（Paddle）

作者：晕晕的劳拉 | 来源：互联网 | 2023-06-02 13:52

虽然我是一个深度学习方面的小白，但是对于卷积神经网络我仍然有很强的好奇心，所以特地学习了一下，如果出现了错误还望大家及时指正*~*。文章目

虽然我是一个深度学习方面的小白&＃xff0c;但是对于卷积神经网络我仍然有很强的好奇心&＃xff0c;所以特地学习了一下&＃xff0c;如果出现了错误还望大家及时指正*~*。

文章目录

- 一、简介
- 二、网络结构
- 三、代码实现&＃xff08;Paddle&＃xff09;
- 四、小结

一、简介

在LeNet提出后的几十年里&＃xff0c;神经网络一度被其他机器学习的方法超越&＃xff0c;而导致出现这种情况的原因主要有&＃xff1a;&＃xff08;1&＃xff09;数据&＃xff0c;一个包含许多特征的深度模型它需要大量的有标签的数据才能表现得比其他经典方法更好&＃xff1b;&＃xff08;2&＃xff09;硬件&＃xff08;算力&＃xff09;&＃xff0c;深度学习对计算资源要求很高&＃xff0c;但是早期的硬件计算能力非常有限。直到2012年&＃xff0c;这两点都得到了很大程度的改善&＃xff0c;这也就造就了AlexNet模型的横空出世。它首次证明了学习到的特征可以超越手工设计的特征&＃xff0c;一举打破了困扰计算机视觉研究的瓶颈。

二、网络结构

AlexNet与LeNet的设计理念非常相似&＃xff0c;但也有非常明显的区别。第一、AlexNet包含5层卷积、2层全连接隐藏层以及1层全连接输出层&＃xff1b;第二、AlexNet模型将sigmoid激活函数更改为了更为简单的ReLU激活函数&＃xff1b;第三、AlexNet通过丢弃法&＃xff08;Dropout&＃xff09;有效的控制了全连接层的模型复杂度&＃xff0c;防止引入过多的参数&＃xff1b;第四、AlexNet引入了大量的图像增广&＃xff0c;如翻转、裁剪以及颜色变化等&＃xff0c;有效的增加了数据样本的数量&＃xff0c;从而缓解了过拟合现象的发生。
由于ImageNet数据集中的图像要比MINST数据集大许多&＃xff0c;所以需要更大的卷积核来捕捉物体&＃xff0c;因此第一层卷积核的窗口为11×11。而第二层卷积核就减少到5×5&＃xff0c;之后就一直采用3×3。此外&＃xff0c;第一、第二和第五个卷积层之后都使用了窗口形状为3×3、步幅为2的最大池化层&＃xff0c;最后就是一般的全连接层。借用书中的图来表示一下&＃xff08;主要是我自己作图太难看*^*&＃xff09;&＃xff1a;

在这里插入图片描述

但是呢&＃xff0c;你只要细心一点就会发现&＃xff0c;第一层卷积层的224×224是有问题的&＃xff0c;应该是227×227才对&＃xff0c;这一点在吴恩达老师的视频中也被提到&＃xff0c;所以正确的图应该是下面这个。

在这里插入图片描述

三、代码实现&＃xff08;Paddle&＃xff09;

虽然知道上面的224×224是有点问题的&＃xff0c;但是我还只能用它来完成我的AlexNet实验&＃xff0c;这是因为当我使用227×227时&＃xff0c;出现了下面的错误&＃xff1a;

在这里插入图片描述

总的来说就是电脑配置有点差&＃xff0c;没法完成这个实验*^*&＃xff0c;所以就将就一下使用224×224来进行测试了&＃xff0c;框架使用的是百度的paddle飞桨&＃xff0c;代码如下所示。

import paddle import paddle.nn.functional as F#组网 class AlexNet(paddle.nn.Layer):def __init__(self) -> None:super(AlexNet,self).__init__()self.conv1 &＃61; paddle.nn.Conv2D(in_channels &＃61; 1, out_channels &＃61; 96, kernel_size &＃61; 11, stride &＃61; 4)self.conv2 &＃61; paddle.nn.Conv2D(in_channels &＃61; 96, out_channels &＃61; 256, kernel_size &＃61; 5, stride &＃61; 1, padding &＃61; 2)self.conv3 &＃61; paddle.nn.Conv2D(in_channels &＃61; 256, out_channels &＃61; 384, kernel_size &＃61; 3, stride &＃61; 1, padding &＃61; 1)self.conv4 &＃61; paddle.nn.Conv2D(in_channels &＃61; 384, out_channels &＃61; 384, kernel_size &＃61; 3, stride &＃61; 1, padding &＃61; 1)self.conv5 &＃61; paddle.nn.Conv2D(in_channels &＃61; 384, out_channels &＃61; 256, kernel_size &＃61; 3, stride &＃61; 1, padding &＃61; 1)self.pool1 &＃61; paddle.nn.MaxPool2D(3,2)self.pool2 &＃61; paddle.nn.MaxPool2D(3,2)self.pool3 &＃61; paddle.nn.MaxPool2D(3,2)self.linear1 &＃61; paddle.nn.Linear(in_features &＃61; 256*5*5, out_features &＃61; 4096)self.linear2 &＃61; paddle.nn.Linear(in_features &＃61; 4096, out_features &＃61; 4096)self.linear3 &＃61; paddle.nn.Linear(in_features &＃61; 4096, out_features &＃61; 10)def forward(self,x):x &＃61; self.conv1(x)x &＃61; F.relu(x)x &＃61; self.pool1(x)x &＃61; self.conv2(x)x &＃61; F.relu(x)x &＃61; self.pool2(x)x &＃61; self.conv3(x)x &＃61; F.relu(x)x &＃61; self.conv4(x)x &＃61; F.relu(x)x &＃61; self.conv5(x)x &＃61; F.relu(x)x &＃61; self.pool3(x)x &＃61; paddle.flatten(x,start_axis&＃61;1,stop_axis&＃61;-1)x &＃61; self.linear1(x)x &＃61; F.relu(x)x &＃61; F.dropout(x,0.5)x &＃61; self.linear2(x)x &＃61; F.relu(x)x &＃61; F.dropout(x,0.5)x &＃61; self.linear3(x)return x#读取数据 def load_data_fashion_mnist(batch_size, resize&＃61;None):"""Download the fashion mnist dataset and then load into memory."""trans &＃61; []if resize:trans.append(paddle.vision.transforms.Resize(size&＃61;resize)) #将输入数据调整为指定大小trans.append(paddle.vision.transforms.ToTensor())transform &＃61; paddle.vision.transforms.Compose(trans)mnist_train &＃61; paddle.vision.datasets.FashionMNIST(mode&＃61;&＃39;train&＃39;, transform&＃61;transform) #由于ImageNet太大所以使用了FashionMNIST数据集mnist_test &＃61; paddle.vision.datasets.FashionMNIST(mode&＃61;&＃39;test&＃39;, transform&＃61;transform)train_iter &＃61; paddle.io.DataLoader(mnist_train,batch_size&＃61;batch_size, shuffle&＃61;True,places&＃61;paddle.CPUPlace())test_iter &＃61; paddle.io.DataLoader(mnist_test,batch_size&＃61;batch_size, shuffle&＃61;False, places&＃61;paddle.CPUPlace()) #places&＃61;paddle.CPUPlace()缺少这个关键字会莫名其妙的停止程序&＃xff0c;飞桨官网的解释是当前还不支持在子进程中进行GPU Tensor的操作&＃xff0c;请不要在子进程流程中使用GPU Tensorreturn train_iter , test_iterbatch_size &＃61; 128 # 如出现“out of memory”的报错信息&＃xff0c;可减⼩batch_size或resize train_iter, test_iter &＃61; load_data_fashion_mnist(batch_size,resize&＃61;224)# 加载训练集 batch_size 设为 128 def train(model):model.train()epochs &＃61; 5optim &＃61; paddle.optimizer.Adam(learning_rate&＃61;0.001, parameters&＃61;model.parameters())# 用Adam作为优化函数for epoch in range(epochs):for batch_id, data in enumerate(train_iter()):x_data &＃61; data[0]y_data &＃61; data[1]predicts &＃61; model(x_data)loss &＃61; F.cross_entropy(predicts, y_data) #交叉熵损失函数# 计算损失acc &＃61; paddle.metric.accuracy(predicts, y_data) #计算数据的准确度loss.backward()if batch_id % 100 &＃61;&＃61; 0:print("epoch: {}, batch_id: {}, loss is: {}, acc is: {}".format(epoch, batch_id, loss.numpy(), acc.numpy()))optim.step()optim.clear_grad() model &＃61; AlexNet() train(model)

运行的效果&＃xff1a;
在这里插入图片描述

四、小结

当然&＃xff0c;每个深度学习的框架里可能都有现成的AlexNet模型&＃xff0c;我这里之所以选择自己构建一下&＃xff0c;主要是出于学习的目的去更好的了解这个模型的一些细节&＃xff0c;自我感觉这样更有趣一些。

参考资料&＃xff1a;《动手学深度学习》《吴恩达老师视频》

推荐阅读

process
深入浅出TensorFlow数据读写机制

本文详细介绍TensorFlow中的数据读写操作，包括TFRecord文件的创建与读取，以及数据集（dataset）的相关概念和使用方法。 ... [详细]

蜡笔小新 2024-12-19 16:23:17
python
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
import
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
import
2017年人工智能领域的十大里程碑事件回顾

随着2018年的临近，我们一同回顾过去一年中人工智能领域的重要进展。这一年，无论是政策层面的支持，还是技术上的突破，都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]

蜡笔小新 2024-12-16 17:59:16
process
Python并行处理：提升数据处理速度的方法与实践

本文探讨了如何利用Python进行数据处理的并行化，通过介绍Numba、多进程处理以及Pandas DataFrame上的并行操作等技术，旨在帮助开发者有效提高数据处理效率。 ... [详细]

蜡笔小新 2024-12-14 11:30:03
import
在Ubuntu 16.04中使用Anaconda安装TensorFlow

本文详细介绍了如何在Ubuntu 16.04系统上通过Anaconda环境管理工具安装TensorFlow。首先，需要下载并安装Anaconda，然后配置环境变量以确保系统能够识别Anaconda命令。接着，创建一个特定的Python环境用于安装TensorFlow，并通过指定的镜像源加速安装过程。最后，通过一个简单的线性回归示例验证TensorFlow的安装是否成功。 ... [详细]

蜡笔小新 2024-12-11 19:07:39
import
使用Objective-C和dispatch库实现并发素数计算

本文介绍如何使用Objective-C结合dispatch库进行并发编程，以提高素数计数任务的效率。通过对比纯C代码与引入并发机制后的代码，展示dispatch库的强大功能。 ... [详细]

蜡笔小新 2024-12-28 08:44:35
import
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
import
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
import
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
process
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新 2024-12-24 08:48:32
import
使用TensorFlow实现非线性回归模型

本文介绍了如何利用TensorFlow框架构建一个简单的非线性回归模型。通过生成200个随机数据点进行训练，模型能够学习并预测这些数据点的非线性关系。 ... [详细]

蜡笔小新 2024-12-20 11:54:20
import
支持向量机（SVM）方法的扩展与优化

支持向量机（SVM）是一种基于统计学习理论的模型，主要在VC维和结构风险最小化的理论基础上发展而来。本文将探讨几种不同的SVM方法及其优化策略，旨在提高模型的效率和适用性。 ... [详细]

蜡笔小新 2024-12-17 14:27:48
import
CART决策树与随机森林详解

本文深入探讨了CART（分类与回归树）的基本原理及其在随机森林中的应用。重点介绍了CART的分裂准则、防止过拟合的方法、处理样本不平衡的策略以及其在回归问题中的应用。此外，还详细解释了随机森林的构建过程、样本均衡处理、OOB估计及特征重要性的计算。 ... [详细]

蜡笔小新 2024-12-16 16:54:15
import
智慧城市建设现状及未来趋势

随着新基建政策的推进及‘十四五’规划的实施，我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型，促进数字政府建设，新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计，以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]

蜡笔小新 2024-12-16 16:43:21

晕晕的劳拉

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章