热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

深度卷积网络:实例探究

经典网络我们需要了解几个经典的神经网络结构,分别是LeNet-5网络、AlexNet和VGGNet首先我们来看LeNet-5网络假设你有一张32*32*1的图片,LeNet-5可以

经典网络

我们需要了解几个经典的神经网络结构,分别是LeNet-5网络、AlexNet和VGGNet

首先我们来看LeNet-5网络

假设你有一张32*32*1的图片,LeNet-5可以识别图片中的手写数字,比如7,此网络是针对灰度图像训练的。

此网络,第一层使用6个5*5的过滤器,步幅为1,padding为0,输出结果为28*28*6。图像尺寸从32*32缩小到28*28,然后进行池化操作,过滤器宽度为2,步幅为2。图像的尺寸高度和宽度都缩小了2倍,输出结果是一个14*14*6的图像;接下来是卷积层,我们用一组16个5*5的过滤器,新的输出结果有16个信道,图像再次缩小。然后又是池化层,高度和宽度再缩小一半,然后乘积是400,下一层是全连接层,在全连接层有400个节点,每个节点有120个神经元,最后一步就是利用这84个特征得到最后的输出。这里使用softmax函数输出 十种分类结果。 

 

 

 下面第二种神经网络是AlexNet

首先用一张227*227*3的图片作为输入,第一层我们使用96个11*11的过滤器,步幅为4,然后尺寸缩小到55*55,然后利用一个3*3的过滤器构建最大池化层,f=3,步幅为2。总面积尺寸缩小为27*27*96。接着再执行一个5*5的卷积,然后再次进行最大池化,尺寸缩小到13*13,再次执行一次与上一步相同的卷积,相同的padding得到的结果是13*13。384个过滤器。再做一次3*3的相同卷积,再做一次同样的操作,最后进行一次最大池化尺寸缩小到6*6*256=9216,将其展开为9216个单元,然后是一些全连接层,最后使用softmax函数输出识别的结果。

 

 

 最后一个网络,VGG-16网络

值得注意的一点是,此网络没有那么多超参,这是一种只需要专注于构建卷积层的简单网络。

首先用3*3 步幅为1的过滤器构建卷积层,padding参数为same。然后用一个2*2,步幅为2的过滤器构建最大池化层,因此VGG网络的一大优点是简化了神经网络结构

假设要识别这样一个图像,在最开始的2层,用64个3*3的过滤器对输入的图像进行卷积,输出结果是224*224,因为进行了相同的卷积,信道数量也一样,进行第一个卷积之后得到224*224的特征图,接着还有一层224*224*64。这意味着我们用64个过滤器进行了两次卷积。接下来创建一个池化层,将输入的图像进行压缩,减少到112*112*64。然后又是若干个卷积层,然后又是若干个卷积层,使用120个过滤器做一些相同的卷积操作,输出结果为112*112*128。然后进行池化,可以推导出池化后的结果,接着再用256个同样的过滤器进行三次卷积操作,然后再池化,再卷积三次,再池化。将最后得到的7*7*512的特征图进行全连接操作,得到4096个单元,然后进行softmax激活,输出从1000个对象中识别的结果

 

 


 残差网络

ResNets是由残差块构建的,什么是残差块

这是一个两层神经网络,在L层进行激活得到a[l+1]再次进行激活,之后得到a[l+2],计算过程是从a[l]开始首先进行线性激活,根据这个等式通过a[l]算出z[l+1],然后通过ReLU非线性激活得到a[l+1],接着再次进行线性激活,最后根据这个等式再次进行ReLU非线性激活。

换句话说,信息流从a[l]到a[l+2]需要经过这组网络层的主路径

 

 


 谷歌Inception网络简介

构建卷积层时,你要决定过滤器的大小究竟是1*3,3*3还是5*5或者要不要添加池化层,而Inception网络的作用就是代替你来做决定。所以Inception网络或者Inception层就是代替人工来确定卷积层中的过滤器类型或者确定是否需要创建卷积层或池化层

 



推荐阅读
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • LeetCode 实战:寻找三数之和为零的组合
    给定一个包含 n 个整数的数组,判断该数组中是否存在三个元素 a、b、c,使得 a + b + c = 0。找出所有满足条件且不重复的三元组。 ... [详细]
  • hdu4539郑厂长系列故事——排兵布阵http:acm.hdu.edu.cnshowproblem.php?pid4539问题描述:给你一个n行m列的0-1矩阵,0表示不 ... [详细]
  • 本文详细介绍了 Java 网站开发的相关资源和步骤,包括常用网站、开发环境和框架选择。 ... [详细]
  • 三角测量计算三维坐标的代码_双目三维重建——层次化重建思考
    双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记,本文从宏观的角度阐 ... [详细]
  • 在《Cocos2d-x学习笔记:基础概念解析与内存管理机制深入探讨》中,详细介绍了Cocos2d-x的基础概念,并深入分析了其内存管理机制。特别是针对Boost库引入的智能指针管理方法进行了详细的讲解,例如在处理鱼的运动过程中,可以通过编写自定义函数来动态计算角度变化,利用CallFunc回调机制实现高效的游戏逻辑控制。此外,文章还探讨了如何通过智能指针优化资源管理和避免内存泄漏,为开发者提供了实用的编程技巧和最佳实践。 ... [详细]
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 中国学者实现 CNN 全程可视化,详尽展示每次卷积、ReLU 和池化过程 ... [详细]
  • HTTP(HyperTextTransferProtocol)是超文本传输协议的缩写,它用于传送www方式的数据。HTTP协议采用了请求响应模型。客服端向服务器发送一 ... [详细]
  • 近期,微信公众平台上的HTML5游戏引起了广泛讨论,预示着HTML5游戏将迎来新的发展机遇。磊友科技的赵霏,作为一名HTML5技术的倡导者,分享了他在微信平台上开发HTML5游戏的经验和见解。 ... [详细]
  • Visual Studio Code (VSCode) 是一款功能强大的源代码编辑器,支持多种编程语言,具备丰富的扩展生态。本文将详细介绍如何在 macOS 上安装、配置并使用 VSCode。 ... [详细]
  • 射频领域的博士学位在信号处理算法方面具有广阔的职业前景,尤其是在射频技术的应用中。例如,加入华为的射频基站部门,从事数字预失真等关键技术的研发工作。在此过程中,需要注意持续跟踪最新的学术和技术进展,保持对行业动态的敏感性,并不断提升自身的实践能力和创新能力。此外,除了技术层面,还应关注行业的整体发展趋势,以便更好地规划职业生涯。 ... [详细]
author-avatar
手机用户2602916141
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有