当前位置: 开发笔记 > 程序员 > 正文

四、经典网络2（AlexNet）

作者：到地球来旅行 | 来源：互联网 | 2023-07-06 17:49

模型结构模型解读conv1阶段DFD（dataflowdiagram）：第一层输入数据为原始的227*227*3的图像，这

模型结构

模型解读

conv1 阶段 DFD&＃xff08;data flow diagram&＃xff09;&＃xff1a;

第一层输入数据为原始的 227*227*3 的图像&＃xff0c;这个图像被 11*11*3 的卷积核进行卷积运算&＃xff0c;卷积核对原始图像的每次卷积都生成一个新的像素。卷积核沿原始图像的 x 轴方向和 y 轴方向两个方向移动&＃xff0c;移动的步长是 4 个像素。因此&＃xff0c;卷积核在移动的过程中会生成(227-11)/4&＃43;1&＃61;55个像素(227 个像素减去 11&＃xff0c;正好是 54&＃xff0c;即生成 54 个像素&＃xff0c;再加上被减去的 11 也对应生成一个像素)&＃xff0c;行和列的 55*55 个像素形成对原始图像卷积之后的像素层。共有 96 个卷积核&＃xff0c;会生成 55*55*96 个卷积后的像素层。96 个卷积核分成 2 组&＃xff0c;每组 48 个卷积核。对应生成 2 组55*55*48 的卷积后的像素层数据。这些像素层经过 relu1 单元的处理&＃xff0c;生成激活像素层&＃xff0c;尺寸仍为 2 组 55*55*48 的像素层数据。这些像素层经过 pool 运算(池化运算)的处理&＃xff0c;池化运算的尺度为 3*3&＃xff0c;运算的步长为 2&＃xff0c;则池化后图像的尺寸为(55-3)/2&＃43;1&＃61;27。即池化后像素的规模为 27*27*96&＃xff1b;然后经过归一化处理&＃xff0c;归一化运算的尺度为 5*5&＃xff1b;第一卷积层运算结束后形成的像素层的规模为 27*27*96。分别对应 96 个卷积核所运算形成。这 96 层像素层分为 2 组,每组 48 个像素层&＃xff0c;每组在一个独立的 GPU 上进行运算。反向传播时&＃xff0c;每个卷积核对应一个偏差值。即第一层的 96 个卷积核对应上层输入的 96 个偏差值。

conv2 阶段 DFD&＃xff08;data flow diagram&＃xff09;&＃xff1a;

第二层输入数据为第一层输出的 27*27*96 的像素层&＃xff0c;为便于后续处理&＃xff0c;每幅像素层的左右两边和上下两边都要填充 2 个像素&＃xff1b;27*27*96 的像素数据分成 27*27*48 的两组像素数据&＃xff0c;两组数据分别再两个不同的 GPU 中进行运算。每组像素数据被 5*5*48 的卷积核进行卷积运算&＃xff0c;卷积核对每组数据的每次卷积都生成一个新的像素。卷积核沿原始图像的 x 轴方向和 y 轴方向两个方向移动&＃xff0c; 移动的步长是1个像素。因此 &＃xff0c;卷积核在移动的过程中会生成 (27-5&＃43;2*2)/1&＃43;1&＃61;27 个像素。27 个像素减去 5&＃xff0c;正好是 22&＃xff0c;在加上上下、左右各填充的 2 个像素&＃xff0c;即生成 26 个像素&＃xff0c;再加上被减去的 5 也对应生成一个像素)&＃xff0c;行和列的 27*27 个像素形成对原始图像卷积之后的像素层。共有 256 个 5*5*48 卷积核&＃xff1b;这 256 个卷积核分成两组&＃xff0c;每组针对一个 GPU 中的 27*27*48 的像素进行卷积运算。会生成两组 27*27*128 个卷积后的像素层。这些像素层经过 relu2 单元的处理&＃xff0c;生成激活像素层&＃xff0c;尺寸仍为两组 27*27*128 的像素层。

这些像素层经过 pool 运算(池化运算)的处理&＃xff0c;池化运算的尺度为 3*3&＃xff0c;运算的步长为 2&＃xff0c;则池化后图像的尺寸为(57-3)/2&＃43;1&＃61;13。即池化后像素的规模为 2 组 13*13*128 的像素层&＃xff1b;然后经过归一化处理&＃xff0c;归一化运算的尺度为 5*5&＃xff1b;第二卷积层运算结束后形成的像素层的规模为2 组 13*13*128 的像素层。分别对应 2 组 128 个卷积核所运算形成。每组在一个 GPU 上进行运算。即共 256 个卷积核&＃xff0c;共 2 个 GPU 进行运算。

反向传播时&＃xff0c;每个卷积核对应一个偏差值。即第一层的 96 个卷积核对应上层输入的 256个偏差值。

conv3 阶段 DFD&＃xff08;data flow diagram&＃xff09;&＃xff1a;

第三层输入数据为第二层输出的 2 组 13*13*128 的像素层&＃xff1b;为便于后续处理&＃xff0c;每幅像素层的左右两边和上下两边都要填充 1 个像素&＃xff1b;2 组像素层数据都被送至 2 个不同的 GPU 中进行运算。每个 GPU 中都有 192 个卷积核&＃xff0c;每个卷积核的尺寸是 3*3*256。因此&＃xff0c;每个 GPU 中的卷积核都能对 2 组 13*13*128 的像素层的所有数据进行卷积运算。卷积核对每组数据的每次卷积都生成一个新的像素。卷积核沿像素层数据的 x 轴方向和 y 轴方向两个方向移动&＃xff0c;移动的步长是1个像素。因此&＃xff0c;运算后的卷积核的尺寸为(13-3&＃43;1*2)/1&＃43;1&＃61;13&＃xff08;13 个像素减去 3&＃xff0c;正好是 10&＃xff0c;在加上上下、左右各填充的 1 个像素&＃xff0c;即生成 12 个像素&＃xff0c;再加上被减去的 3 也对应生成一个像素&＃xff09;&＃xff0c;每个 GPU 中共 13*13*192 个卷积核。2 个 GPU 中共 13*13*384 个卷积后的像素层。这些像素层经过 relu3 单元的处理&＃xff0c;生成激活像素层&＃xff0c;尺寸仍为 2 组 13*13*192 像素层&＃xff0c;共13*13*384 个像素层。

conv4 阶段 DFD&＃xff08;data flow diagram&＃xff09;&＃xff1a;

第四层输入数据为第三层输出的 2 组 13*13*192 的像素层&＃xff1b;为便于后续处理&＃xff0c;每幅像素层的左右两边和上下两边都要填充 1 个像素&＃xff1b;2 组像素层数据都被送至 2 个不同的 GPU 中进行运算。每个 GPU 中都有 192 个卷积核&＃xff0c;每个卷积核的尺寸是 3*3*192。因此&＃xff0c;每个 GPU 中的卷积核能对 1 组 13*13*192 的像素层的数据进行卷积运算。卷积核对每组数据的每次卷积都生成一个新的像素。卷积核沿像素层数据的 x 轴方向和 y 轴方向两个方向移动&＃xff0c;移动的步长是 1 个像素。因此&＃xff0c;运算后的卷积核的尺寸为(13-3&＃43;1*2)/1&＃43;1&＃61;13&＃xff08;13 个像素减去 3&＃xff0c;正好是 10&＃xff0c;在加上上下、左右各填充的 1 个像素&＃xff0c;即生成 12 个像素&＃xff0c;再加上被减去的 3 也对应生成一个像素&＃xff09;&＃xff0c;每个 GPU 中共 13*13*192 个卷积核。2 个 GPU 中共 13*13*384 个卷积后的像素层。这些像素层经过 relu4 单元的处理&＃xff0c;生成激活像素层&＃xff0c;尺寸仍为 2 组 13*13*192 像素层&＃xff0c;共 13*13*384 个像素层。

conv5 阶段 DFD&＃xff08;data flow diagram&＃xff09;&＃xff1a;

第五层输入数据为第四层输出的2组13*13*192的像素层&＃xff1b;为便于后续处理&＃xff0c;每幅像素层的左右两边和上下两边都要填充1个像素&＃xff1b;2组像素层数据都被送至2个不同的GPU中进行运算。每个GPU中都有128个卷积核&＃xff0c;每个卷积核的尺寸是3*3*192。因此&＃xff0c;每个GPU中的卷积核能对1组13*13*192的像素层的数据进行卷积运算。卷积核对每组数据的每次卷积都生成一个新的像素。卷积核沿像素层数据的x轴方向和y轴方向两个方向移动&＃xff0c;移动的步长是1个像素。因此&＃xff0c;运算后的卷积核的尺寸为(13-3&＃43;1*2)/1&＃43;1&＃61;13&＃xff08;13个像素减去3&＃xff0c;正好是10&＃xff0c;在加上上下、左右各填充的1个像素&＃xff0c;即生成12个像素&＃xff0c;再加上被减去的3也对应生成一个像素&＃xff09;&＃xff0c;每个GPU中共13*13*128个卷积核。2个GPU中共13*13*256个卷积后的像素层。这些像素层经过relu5单元的处理&＃xff0c;生成激活像素层&＃xff0c;尺寸仍为2组13*13*128像素层&＃xff0c;共13*13*256个像素层。

2组13*13*128像素层分别在2个不同GPU中进行池化(pool)运算处理。池化运算的尺度为3*3&＃xff0c;运算的步长为2&＃xff0c;则池化后图像的尺寸为(13-3)/2&＃43;1&＃61;6。即池化后像素的规模为两组6*6*128的像素层数据&＃xff0c;共6*6*256规模的像素层数据。

fc6 阶段 DFD&＃xff08;data flow diagram&＃xff09;&＃xff1a;

第六层输入数据的尺寸是6*6*256&＃xff0c;采用6*6*256尺寸的滤波器对第六层的输入数据进行卷积运算&＃xff1b;每个6*6*256尺寸的滤波器对第六层的输入数据进行卷积运算生成一个运算结果&＃xff0c;通过一个神经元输出这个运算结果&＃xff1b;共有4096个6*6*256尺寸的滤波器对输入数据进行卷积运算&＃xff0c;通过4096个神经元输出运算结果&＃xff1b;这4096个运算结果通过relu激活函数生成4096个值&＃xff1b;并通过drop运算后输出4096个本层的输出结果值。

由于第六层的运算过程中&＃xff0c;采用的滤波器的尺寸(6*6*256)与待处理的feature map的尺寸(6*6*256)相同&＃xff0c;即滤波器中的每个系数只与feature map中的一个像素值相乘&＃xff1b;而其它卷积层中&＃xff0c;每个滤波器的系数都会与多个feature map中像素值相乘&＃xff1b;因此&＃xff0c;将第六层称为全连接层。

第五层输出的6*6*256规模的像素层数据与第六层的4096个神经元进行全连接&＃xff0c;然后经由relu6进行处理后生成4096个数据&＃xff0c;再经过dropout6处理后输出4096个数据。

fc7 阶段 DFD&＃xff08;data flow diagram&＃xff09;&＃xff1a;

第六层输出的 4096 个数据与第七层的 4096 个神经元进行全连接&＃xff0c;然后经由 relu7 进行处理后生成 4096 个数据&＃xff0c;再经过 dropout7 处理后输出 4096 个数据。

fc8 阶段 DFD&＃xff08;data flow diagram&＃xff09;&＃xff1a;

第七层输出的 4096 个数据与第八层的 1000 个神经元进行全连接&＃xff0c;经过训练后输出被训练的数值。

模型特性

使用 ReLU 作为非线性

使用 dropout 技术选择性地忽略训练中的单个神经元&＃xff0c;避免模型的过拟合

重叠最大池化&＃xff08;overlapping max pooling&＃xff09;&＃xff0c;避免平均池化&＃xff08;average pooling&＃xff09;的平均效应

使用 NVIDIA GTX 580 GPU 减少训练时间

当时&＃xff0c;GPU 比 CPU 提供了更多的核心&＃xff0c;可以将训练速度提升 10 倍&＃xff0c;从而允许使用更大的数据集和更大的图像。

推荐阅读

gpu
现代信号处理电路设计概论

本文探讨了现代信号处理系统的核心组件，包括数据转换、数据交互和数据处理。详细介绍了AD/DA转换、串/并转换、编解码转换等技术，并讨论了FPGA在信号处理中的应用及其实现方法。 ... [详细]

蜡笔小新 2024-12-25 14:53:09
gpu
Valve 发布 Steam Deck 的新版 Windows 驱动程序

Valve 最新发布了针对 Steam Deck 掌机的 Windows 驱动程序，旨在提升其在 Windows 环境下的兼容性、安全性和性能表现。 ... [详细]

蜡笔小新 2024-12-28 10:31:16
gpu
vivo发布iQOO 11系列：搭载骁龙8 Gen2与多项创新技术

vivo正式推出iQOO 11系列智能手机，该系列搭载最新的高通骁龙8 Gen2处理器，并引入多项创新技术，致力于为用户提供卓越的性能和游戏体验。 ... [详细]

蜡笔小新 2024-12-25 10:55:38
gpu
存储器层次结构、随机访问存储器与数据存取机制

理解存储器的层次结构有助于程序员优化程序性能，通过合理安排数据在不同层级的存储位置，提升CPU的数据访问速度。本文详细探讨了静态随机访问存储器（SRAM）和动态随机访问存储器（DRAM）的工作原理及其应用场景，并介绍了存储器模块中的数据存取过程及局部性原理。 ... [详细]

蜡笔小新 2024-12-27 12:06:47
编程
Ubuntu系统中下载64位Intel版本的指南

本文详细介绍了如何在Ubuntu系统中下载适用于Intel处理器的64位版本，涵盖了不同Linux发行版对64位架构的不同命名方式，并提供了具体的下载链接和步骤。 ... [详细]

蜡笔小新 2024-12-26 11:24:01
编译
Linux设备驱动程序：异步时间操作与调度机制

本文介绍了Linux内核中的几种异步延迟操作方法，包括内核定时器、tasklet机制和工作队列。这些机制允许在未来的某个时间点执行任务，而无需阻塞当前线程，从而提高系统的响应性和效率。 ... [详细]

蜡笔小新 2024-12-26 08:55:03
编译
台式电脑的电力消耗：待机一天耗电多少？

探讨台式电脑的电力消耗问题，特别是待机状态下的能耗。本文将详细介绍影响电脑功耗的因素，并提供计算和优化电源配置的方法。 ... [详细]

蜡笔小新 2024-12-25 23:58:58
编程
MySQL索引详解与优化

本文深入探讨了MySQL中的索引机制，包括索引的基本概念、优势与劣势、分类及其实现原理，并详细介绍了索引的使用场景和优化技巧。通过具体示例，帮助读者更好地理解和应用索引以提升数据库性能。 ... [详细]

蜡笔小新 2024-12-25 19:52:47
运维
基于KVM的SRIOV直通配置及性能测试

SRIOV介绍、VF直通配置，以及包转发率性能测试小慢哥的原创文章，欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]

蜡笔小新 2024-12-25 19:26:39
service
深入探讨CPU虚拟化与KVM内存管理

本文详细介绍了现代服务器架构中的CPU虚拟化技术，包括SMP、NUMA和MPP三种多处理器结构，并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景，帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]

蜡笔小新 2024-12-25 19:15:51
编程
如何在Linux系统中运行PHP脚本

本文将详细介绍如何在Linux操作系统中执行PHP脚本，包括环境配置、命令使用及验证方法。对于需要在Linux环境下开发或部署PHP应用的用户来说，这是一篇非常实用的文章。 ... [详细]

蜡笔小新 2024-12-25 17:00:00
编程
Spring Boot 服务的最大并发处理能力

本文探讨了 Spring Boot 应用程序在不同配置下支持的最大并发连接数，重点分析了内置服务器（如 Tomcat、Jetty 和 Undertow）的默认设置及其对性能的影响。 ... [详细]

蜡笔小新 2024-12-25 16:45:57
service
优化Windows系统以提升DAW性能

配置Windows操作系统以确保DAW（数字音频工作站）硬件和软件的高效运行可能是一个复杂且令人沮丧的过程。本文提供了一系列专业建议，帮助你优化Windows系统，确保录音和音频处理的流畅性。 ... [详细]

蜡笔小新 2024-12-25 09:41:14
service
电脑蓝屏故障的成因与解决方案（下）

本文深入探讨了导致电脑蓝屏的具体原因，并提供了相应的解决方法，帮助用户更好地理解和处理这一常见问题。 ... [详细]

蜡笔小新 2024-12-24 20:57:29
service
深入解析TCP/IP五层协议

本文详细介绍了TCP/IP五层协议模型，包括物理层、数据链路层、网络层、传输层和应用层。每层的功能及其相互关系将被逐一解释，帮助读者理解互联网通信的原理。此外，还特别讨论了UDP和TCP协议的特点以及三次握手、四次挥手的过程。 ... [详细]

蜡笔小新 2024-12-24 14:02:48

到地球来旅行

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章