爆肝总结：神经网络大杂烩

作者：pigwangrq | 来源：互联网 | 2023-09-18 17:00

文章目录purpose：来龙去脉LeNet5AlexnetVGGGoogleInceptionResNetDenseNetpurpose：论文里面经常

文章目录

- - purpose&＃xff1a;
  - 来龙去脉
  - LeNet5
  - Alexnet
  - VGG
  - Google Inception
  - ResNet
  - DenseNet

purpose&＃xff1a;

论文里面经常会有对比实验&＃xff0c;经常会用到一些较经典的网络。例如Alexnet网络是从Imagenet大赛中脱颖而出的模型&＃xff0c;但是其原始的输入大小与输出大小可能与我们的任务并不相符。这种情况我们怎么使用经典的网络结构来做对比实验呢&＃xff1f;

看过了一些论文复现的代码&＃xff0c;大多数作者是这样处理的&＃xff1a;

尽量保留经典模型的网络结构。如果任务不同&＃xff0c;该改的还是要改。也就是说&＃xff0c;他们复现的经典网络结构与其真实的本貌并不完全相同

在此&＃xff0c;将常用网络模型的来源&＃xff0c;实现以及其结构图总结起来&＃xff0c;以便日后翻阅。如下内容实现的神经网络类&＃xff0c;均可以运行。举例如下&＃xff1a;

batch_size &＃61; 10 x &＃61; torch.rand(3,224,224) x &＃61; x.expand(batch_size,*x.size()) model &＃61; DenseNet121(init_channel&＃61;60) out &＃61; model(x) print (out.shape)

Tips&＃xff1a;

如下网络模型代码不一定完全符合其本貌。但会最大限度的使其相似。

来龙去脉

&＃xff08;1&＃xff09;理论萌芽阶段。1962年Hubel以及Wiesel通过生物学研究表明&＃xff0c;从视网膜传递脑中的视觉信息是通过多层次的感受野&＃xff08;Receptive Field&＃xff09;激发完成的&＃xff0c;并首先提出了感受野的概念。1980年日本学者Fukushima在基于感受野的概念基础之上&＃xff0c;提出了神经认知机(Neocognitron)。神经认知机是一个自组织的多层神经网络模型&＃xff0c;每一层的响应都由上一层的局部感受野激发得到&＃xff0c;对于模式的识别不受位置、较小形状变化以及尺度大小的影响。神经认知机可以理解为卷积神经网络的第一版&＃xff0c;核心点在于将视觉系统模型化&＃xff0c;并且不受视觉中的位置和大小等影响。

&＃xff08;2&＃xff09;实验发展阶段。1998年计算机科学家Yann LeCun等提出的LeNet5采用了基于梯度的反向传播算法对网络进行有监督的训练&＃xff0c;Yann LeCun在机器学习、计算机视觉等都有杰出贡献&＃xff0c;被誉为卷积神经网络之父。LeNet5网络通过交替连接的卷积层和下采样层&＃xff0c;将原始图像逐渐转换为一系列的特征图&＃xff0c;并且将这些特征传递给全连接的神经网络&＃xff0c;以根据图像的特征对图像进行分类。感受野是卷积神经网络的核心&＃xff0c;卷积神经网络的卷积核则是感受野概念的结构表现。学术界对于卷积神经网络的关注&＃xff0c;也正是开始于LeNet5网络的提出&＃xff0c;并成功应用于手写体识别。同时&＃xff0c;卷积神经网络在语音识别、物体检测、人脸识别等应用领域的研究也逐渐开展起来。
&＃xff08;3&＃xff09;大规模应用和深入研究阶段。在LeNet5网络之后&＃xff0c;卷积神经网络一直处于实验发展阶段。直到2012年AlexNet网络的提出才奠定了卷积神经网络在深度学习应用中的地位&＃xff0c;Krizhevsky&＃xff08;他是hintion的学生对应的论文就是刚开始提到的深度卷积神经网络&＃xff09;等提出的卷积神经网络AlexNet在ImageNet的训练集上取得了图像分类的冠军&＃xff0c;使得卷积神经网络成为计算机视觉中的重点研究对象&＃xff0c;并且不断深入。在AlexNet之后&＃xff0c;不断有新的卷积神经网络提出&＃xff0c;包括牛津大学的VGG网络、微软的ResNet网络、谷歌的GoogLeNet网络等&＃xff0c;这些网络的提出使得卷积神经网络逐步开始走向商业化应用&＃xff0c;几乎只要是存在图像的地方&＃xff0c;就会有卷积神经网络的身影。
从目前的发展趋势而言&＃xff0c;卷积神经网络将依然会持续发展&＃xff0c;并且会产生适合各类应用场景的卷积神经网络&＃xff0c;例如&＃xff0c;面向视频理解的3D卷积神经网络等。值得说明的是&＃xff0c;卷积神经网络不仅仅应用于图像相关的网络&＃xff0c;还包括与图像相似的网络&＃xff0c;例如&＃xff0c;在围棋中分析棋盘等。

LeNet5

特点&＃xff1a;

LeNet是卷积神经网络的祖师爷LeCun在1998年提出&＃xff0c;用于解决手写数字识别的视觉任务。自那时起&＃xff0c;CNN的最基本的架构就定下来了&＃xff1a;卷积层、池化层、全连接层。如今各大深度学习框架中所使用的LeNet都是简化改进过的LeNet-5&＃xff08;-5表示具有5个层&＃xff09;。和原始的LeNet有些许不同&＃xff0c;比如把激活函数改为了现在很常用的ReLu。
输入尺寸为32 * 32 * 1大小&＃xff0c;通道不限&＃xff0c;输出为10分类任务。其模型有近五万个参数。

import torch import torch.nn as nnclass Alexnet(nn.Module):def __init__(self):super(Alexnet,self).__init__()# in_channel,out_channel,kernel_sizeself.lrn &＃61; nn.LocalResponseNorm(2)self.relu &＃61; nn.ReLU()self.max_pool &＃61; nn.MaxPool2d(3,stride&＃61;2)self.drop &＃61; nn.Dropout(p&＃61;0.5)self.conv1 &＃61; nn.Conv2d(3,96,11,stride&＃61;4,padding&＃61;2)self.conv2 &＃61; nn.Conv2d(96,256,5,stride&＃61;1,padding&＃61;2)self.conv3 &＃61; nn.Conv2d(256,384,3,padding&＃61;1)self.conv4 &＃61; nn.Conv2d(384,384,3,padding&＃61;1)self.conv5 &＃61; nn.Conv2d(384,256,3,padding&＃61;1)# 任务不同如下的linear里面的神经元的个数需要改动self.linear1 &＃61; nn.Linear(6*6*256,4096)self.linear2 &＃61; nn.Linear(4096,4096)self.linear3 &＃61; nn.Linear(4096,1000)def forward(self,x):x &＃61; self.max_pool(self.lrn(self.relu(self.conv1(x))))x &＃61; self.max_pool(self.lrn(self.relu(self.conv2(x))))# 第三与第四卷积层没有lrn与max_poolx &＃61; self.relu(self.conv3(x))x &＃61; self.relu(self.conv4(x))x &＃61; self.max_pool(self.lrn(self.relu(self.conv5(x))))x &＃61; x.view(x.size(0),-1)x &＃61; self.drop(self.relu(self.linear1(x)))x &＃61; self.drop(self.relu(self.linear2(x)))x &＃61; self.relu(self.linear3(x))return x

VGG

特点&＃xff1a;

VGGNet是牛津大学计算机视觉组和DeepMind公司共同研发一种深度卷积网络&＃xff0c;并且在2014年在ILSVRC比赛上获得了分类项目的第二名和定位项目的第一名。
VGG最大的贡献就是证明了卷积神经网络的深度增加和小卷积核的使用对网络的最终分类识别效果有很大的作用。
如下图所示&＃xff0c;VGGNet一共有六种不同的网络结构&＃xff08;A、A-LRN、B、C、D、E&＃xff09;&＃xff0c;这6种网络结构相似&＃xff0c;都是由5层卷积层、3层全连接层组成&＃xff0c;其中区别在于每个卷积层的子层数量不同&＃xff0c;从A至E依次增加&＃xff08;子层数量从1到4&＃xff09;&＃xff0c;总的网络深度从11层到19层。
以下会复现VGG16的代码。 VGG16输入大小为224 * 224 * 3&＃xff0c;输出为1000个类别。其模型有1.38亿个参数&＃xff0c;也就是138M个参数。

请添加图片描述

class VGG16(nn.Module):def __init__(self):super(VGG16,self).__init__()# 共五个大层卷积层&＃xff0c;大层里面有1-3个小层# 由于VGG所有padding都为1&＃xff0c;卷积核大小都是3&＃xff0c;故使用循环构建self.layers &＃61; self.make_layers([64,64,&＃39;M&＃39;,128,128,&＃39;M&＃39;,256,256,256,&＃39;M&＃39;,512,512,512,&＃39;M&＃39;,512,512,512,&＃39;M&＃39;])self.linear1 &＃61; nn.Linear(512*7*7,4096)self.linear2 &＃61; nn.Linear(4096,4096)self.linear3 &＃61; nn.Linear(4096,1000)def make_layers(self,layer_info):layer &＃61; []in_channel &＃61; 3for info in layer_info:if info &＃61;&＃61; &＃39;M&＃39;:layer.append(nn.MaxPool2d(2,2))else:layer.append(nn.Conv2d(in_channel,info,3,padding&＃61;1))layer.append(nn.ReLU(inplace&＃61;True))in_channel &＃61; inforeturn nn.Sequential(*layer)def forward(self,x):x &＃61; self.layers(x)x &＃61; x.view(x.size(0),-1)x &＃61; self.linear1(x)x &＃61; self.linear2(x)x &＃61; self.linear3(x)return x

Google Inception

特点&＃xff1a;

Google Inception Net在2014年的Imagenet ILSVRC中取得第一名&＃xff0c;该网络以结构上的创新取胜&＃xff0c;通过采用全局平均池化层取代全连接层&＃xff0c;极大的降低了参数量&＃xff0c;是非常实用的模型&＃xff0c;一般称该网络模型为Inception V1。
一个Inception模块&＃xff0c;大概长如下图样子。大概参数有5M左右。代码过长&＃xff0c;太难搞了&＃xff0c;细节自己研究去吧【狗头保命】。

请添加图片描述

class ResNet18(nn.Module):def __init__(self):super(ResNet18,self).__init__()self.conv1 &＃61; nn.Sequential(nn.Conv2d(3,64,kernel_size&＃61;7,stride&＃61;2,padding&＃61;3),nn.MaxPool2d(kernel_size&＃61;3,stride&＃61;2,padding&＃61;1)) self.conv2 &＃61; nn.Sequential(BasicBlock(64,64,stride&＃61;1),BasicBlock(64,64,stride&＃61;1))self.conv3 &＃61; nn.Sequential(BasicBlock(64,128,stride&＃61;2),BasicBlock(128,128,stride&＃61;1))self.conv4 &＃61; nn.Sequential(BasicBlock(128,256,stride&＃61;2),BasicBlock(256,256,stride&＃61;1))self.conv5 &＃61; nn.Sequential(BasicBlock(256,512,stride&＃61;2),BasicBlock(512,512,stride&＃61;1))self.avg_pool &＃61; nn.AdaptiveAvgPool2d((1, 1))self.fc &＃61; nn.Linear(512,1000)def forward(self,x):x &＃61; self.conv1(x)x &＃61; self.conv2(x)x &＃61; self.conv3(x)x &＃61; self.conv4(x)x &＃61; self.conv5(x)x &＃61; self.avg_pool(x)x &＃61; x.view(x.size(0),-1)x &＃61; self.fc(x)return xclass BasicBlock(nn.Module):# 如果stride等于2&＃xff0c;就说明要进行下采样def __init__(self,in_channel,out_channel,stride&＃61;1):super(BasicBlock,self).__init__()if stride &＃61;&＃61; 2:self.downsample &＃61; nn.Conv2d(in_channel,out_channel,kernel_size&＃61;1,stride&＃61;stride)else:self.downsample &＃61; Noneself.relu &＃61; nn.ReLU(inplace&＃61;True)self.conv1 &＃61; nn.Conv2d(in_channel,out_channel,kernel_size&＃61;3,padding&＃61;1,stride&＃61;stride)self.conv2 &＃61; nn.Conv2d(out_channel,out_channel,kernel_size&＃61;3,padding&＃61;1,stride&＃61;1)def forward(self,x):x_add &＃61; xout &＃61; self.relu(self.conv1(x))out &＃61; self.relu(self.conv2(out))if self.downsample is not None:x_add &＃61; self.downsample(x)out &＃43;&＃61; x_addreturn out

DenseNet

特点&＃xff1a;

在残差网络之后&＃xff0c;又出现了密集网络DenseNet&＃xff08;CVPR2017年的Best Paper&＃xff09;。它脱离了加深网络层数(ResNet)和加宽网络结构(Inception)来提升网络性能的定式思维,从特征的角度考虑,通过特征重用和旁路(Bypass)设置,既大幅度减少了网络的参数量,又在一定程度上缓解了gradient vanishing问题的产生。
密集网络顾名思义&＃xff0c;它的连接更为密集&＃xff0c;最明显的标志是密集模块即Dense Block。在Dense Block中&＃xff0c;每一层都与其他层”沟通“&＃xff0c;这种密集的联系&＃xff0c;使得信息流最大化&＃xff0c;也实现了特征的重复利用。同时网络的每一层可以被设计得特别”窄“&＃xff0c;即只使用了比较少的特征图&＃xff0c;可以达到降低冗余的目的&＃xff0c;这使得DenseNet的计算量也比较小。
相比ResNet拥有更少的参数数量&＃xff0c;如下实现DenseNet-121网络&＃xff0c;只有大约8M个参数。输入为224 * 224 * 3&＃xff0c;输出为1000类。

请添加图片描述

# 完成基本内容块的制作&＃xff0c;包括输入维度&＃xff0c;增长速率k&＃xff0c;bn_size # 类前面加下划线&＃xff0c;表示此类只用于内部访问 import torch import torch.nn as nn import torch.nn.functional as F from collections import OrderedDictclass _DenseLayer(nn.Sequential):def __init__(self,in_channel,grow_rate,bn_size):super(_DenseLayer,self).__init__()self.add_module(&＃39;bn1&＃39;,nn.BatchNorm2d(in_channel))self.add_module(&＃39;relu1&＃39;,nn.ReLU(inplace &＃61; True))self.add_module(&＃39;conv1&＃39;,nn.Conv2d(in_channel,bn_size*grow_rate,kernel_size&＃61;1,bias&＃61;False))self.add_module(&＃39;bn2&＃39;,nn.BatchNorm2d(bn_size*grow_rate))self.add_module(&＃39;relu2&＃39;,nn.ReLU(inplace &＃61; True))self.add_module(&＃39;conv2&＃39;,nn.Conv2d(bn_size*grow_rate,grow_rate,kernel_size&＃61;3,padding&＃61;1,bias&＃61;False))# 这个实际上nn.Sequential已经实现了的# 这里我们需要重写&＃xff0c;使得前后相连def forward(self,input):new_feature &＃61; super(_DenseLayer,self).forward(input)# 在维度为1的位置将其串联起来return torch.cat([input,new_feature],1)class _DenseBlock(nn.Sequential):def __init__(self,layer_nums,in_channel,grow_rate,bn_size):super(_DenseBlock,self).__init__() for i in range(layer_nums):self.add_module(&＃39;layer{}&＃39;.format(i&＃43;1),_DenseLayer(in_channel&＃43;grow_rate*i,grow_rate,bn_size))def forward(self,input):for m in self:input &＃61; m(input)return inputclass _TransitionLayer(nn.Sequential):def __init__(self,in_channel,out_channel):super(_TransitionLayer,self).__init__()self.add_module(&＃39;norm&＃39;, nn.BatchNorm2d(in_channel))self.add_module(&＃39;relu&＃39;, nn.ReLU(inplace&＃61;True))self.add_module(&＃39;conv&＃39;,nn.Conv2d(in_channel,out_channel,kernel_size&＃61;1,bias&＃61;False))self.add_module(&＃39;avg_pool&＃39;,nn.AvgPool2d(stride&＃61;2,kernel_size&＃61;2))def forward(self,input):for m in self:input &＃61; m(input)return inputclass DenseNet121(nn.Module):def __init__(self,init_channel&＃61;64,grow_rate&＃61;32,bn_size&＃61;4):super(DenseNet121,self).__init__()block_list &＃61; [6,12,24,16]self.all_feature &＃61; nn.Sequential(OrderedDict([(&＃39;conv1&＃39;,nn.Conv2d(3,init_channel,kernel_size&＃61;7,stride&＃61;2,padding&＃61;3)),(&＃39;bn1&＃39;,nn.BatchNorm2d(init_channel)),(&＃39;relu1&＃39;,nn.ReLU(inplace&＃61;True)),(&＃39;max_pool1&＃39;,nn.MaxPool2d(kernel_size&＃61;3,stride&＃61;2,padding&＃61;1))]))cur_channel &＃61; init_channelfor i,block_num in enumerate(block_list):self.all_feature.add_module(&＃39;DenseBlock{}&＃39;.format(i&＃43;1),_DenseBlock(block_num,cur_channel,grow_rate,bn_size))cur_channel &＃61; cur_channel &＃43; grow_rate*block_numif i !&＃61; len(block_list)-1:self.all_feature.add_module(&＃39;Transition{}&＃39;.format(i&＃43;1),_TransitionLayer(cur_channel,cur_channel//2))# print (cur_channel)# 使用//是因为&＃xff0c;保证通道数为整数cur_channel &＃61; cur_channel//2# print (cur_channel)self.classifier &＃61; nn.Linear(cur_channel,1000)def forward(self,x):x &＃61; self.all_feature(x)x &＃61; F.relu(x,inplace&＃61;True)x &＃61; F.avg_pool2d(x,kernel_size&＃61;7)x &＃61; x.view(x.size(0),-1)x &＃61; self.classifier(x)return x # DenseNet121()

参考资料&＃xff1a;

具体网络结构详情&＃xff0c;可见如下链接&＃xff1a;

AlexNet&＃xff1a;https://blog.csdn.net/luoluonuoyasuolong/article/details/81750190

VGG&＃xff1a;https://blog.csdn.net/daydayup_668819/article/details/79932324

ResNet&＃xff1a;https://zhuanlan.zhihu.com/p/79378841

ResNet&＃xff1a;https://www.jianshu.com/p/085f4c8256f1

DenseNet&＃xff1a;https://zhuanlan.zhihu.com/p/67311529

DenseNet&＃xff1a;https://zhuanlan.zhihu.com/p/43057737

DenseNet&＃xff1a;https://www.cnblogs.com/lyp1010/p/11820967.html

Google Inception&＃xff1a;https://www.jianshu.com/p/680645517020

Google Inception&＃xff1a;https://blog.csdn.net/sinat_29957455/article/details/80766850

代码汇总&＃xff1a;

https://colab.research.google.com/drive/1mAcCzTb038-NuQ8IGDHmeWqGSzO3z7R4?usp&＃61;sharing

推荐阅读

ip
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
import
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
buffer
字节流(InputStream和OutputStream)，字节流读写文件，字节流的缓冲区，字节缓冲流

字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream，所有的输出流都继承子OutputStreamInput ... [详细]

蜡笔小新 2024-11-12 14:07:25
import
Java 编程错误：对象无法转换为 long 类型

本文介绍了在 Java 编程中遇到的一个常见错误：对象无法转换为 long 类型，并提供了详细的解决方案。 ... [详细]

蜡笔小新 2024-11-13 10:57:24
function
Java 中如何将多参数方法传递给使用 List 的 Function

本文探讨了如何在 Java 中将多参数方法通过 Lambda 表达式传递给一个接受 List 的 Function。具体分析了 `OrderUtil` 类中的 `runInBatches` 方法及其使用场景。 ... [详细]

蜡笔小新 2024-11-12 22:25:23
ip
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新 2024-11-12 16:19:40
go
杜甫《喜晴》的两种英译比较

本文对比了杜甫《喜晴》的两种英文翻译版本：a. Pleased with Sunny Weather 和 b. Rejoicing in Clearing Weather。a 版由 alexcwlin 翻译并经 Adam Lam 编辑，b 版则由哈佛大学的宇文所安教授 (Prof. Stephen Owen) 翻译。 ... [详细]

蜡笔小新 2024-11-12 15:02:28
import
实验九：使用SharedPreferences存储简单数据

本实验旨在帮助学生理解和掌握使用SharedPreferences存储和读取简单数据的方法，包括程序参数和用户选项。 ... [详细]

蜡笔小新 2024-11-12 14:21:47
foreach
深入解析 Lifecycle 的实现原理

本文将详细介绍 Android Jetpack 中 Lifecycle 组件的实现原理，帮助开发者更好地理解和使用 Lifecycle，避免常见的内存泄漏问题。 ... [详细]

蜡笔小新 2024-11-12 14:05:19
ip
解决Bootstrap DataTable Ajax请求重复问题

在最近的一个项目中，我们使用了JQuery DataTable进行数据展示，虽然使用起来非常方便，但在测试过程中发现了一个问题：当查询条件改变时，有时查询结果的数据不正确。通过FireBug调试发现，点击搜索按钮时，会发送两次Ajax请求，一次是原条件的请求，一次是新条件的请求。 ... [详细]

蜡笔小新 2024-11-12 13:59:27
ip
检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0

检查在所有可能的“？”替换中，给定的二进制字符串中是否出现子字符串“10”带 1 或 0 ... [详细]

蜡笔小新 2024-11-12 11:35:01
sum
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
ip
使用 Matplotlib 保存 Python 动态图像为视频文件的方法与技巧

本文介绍了如何利用 `matplotlib` 库中的 `FuncAnimation` 类将 Python 中的动态图像保存为视频文件。通过详细解释 `FuncAnimation` 类的参数和方法，文章提供了多种实用技巧，帮助用户高效地生成高质量的动态图像视频。此外，还探讨了不同视频编码器的选择及其对输出文件质量的影响，为读者提供了全面的技术指导。 ... [详细]

蜡笔小新 2024-11-11 22:11:30
require
XAMPP 遇到 404 错误：无法找到请求的对象

在使用 XAMPP 时遇到 404 错误，表示请求的对象未找到。通过详细分析发现，该问题可能由以下原因引起：1. `httpd-vhosts.conf` 文件中的配置路径错误；2. `public` 目录下缺少 `.htaccess` 文件。建议检查并修正这些配置，以确保服务器能够正确识别和访问所需的文件路径。 ... [详细]

蜡笔小新 2024-11-11 18:20:00
ip
利用 Node.js 和 Express（4.x 及以上版本）构建高效文件上传功能

本文介绍了如何使用 Node.js 和 Express（4.x 及以上版本）构建高效的文件上传功能。通过引入 `multer` 中间件，可以轻松实现文件上传。首先，需要通过 `npm install multer` 安装该中间件。接着，在 Express 应用中配置 `multer`，以处理多部分表单数据。本文详细讲解了 `multer` 的基本用法和高级配置，帮助开发者快速搭建稳定可靠的文件上传服务。 ... [详细]

蜡笔小新 2024-11-11 18:02:17

pigwangrq

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章