热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

卷积神经网络的权值参数个数的量化分析

考虑的输入图像:全连接,隐层神经元的数目为卷积,卷积核的大小为时,步长为10,表示的是输入图像可划分的块数,也即经卷机作用后的输出图像;步长为1,在不考虑步长的前提下,可近似将待学

考虑 的输入图像:

  • 全连接,隐层神经元的数目为
  • 卷积,卷积核的大小为 时,
    • 步长为 10,表示的是输入图像可划分的块数,也即经卷机作用后的输出图像;
    • 步长为 1,
    • 在不考虑步长的前提下,可近似将待学习的参数的数目视为
  • 1. 全连接层对参数个数的显著提升

    现考虑图像输入层和 500 个隐层神经元的全连接:

    • MNIST:
    • CIfar:,极大地降低了参数的规模;

    参数增多导致计算速度减慢,且很容易导致过拟合。

    2. 卷积的共享参数特性

    通过一个某一卷积核(过滤器),将一个 本次卷积操作,共需要的参数为:

    +5 表示偏值项参数,

    对于 cifar-10 数据集,输入层矩阵的维度是 深度为 16,则此卷基层的参数为:

    注意区分卷积层的参数,与当前输入层与卷积层的连接的个数(也即参数的个数与连接的数目):

    比如对于 LeNet-5 网络, 的特征映射:

    • 卷积层的参数:
      • 核的长*核的宽*输入的通道数*输出的通道数;
    • 卷积层共
      • 连接的数目与输入层的大小无关;

    3. 卷积输出矩阵尺寸的大小

    通过使用填充(padding,比如 zero-padding),或者使用过滤器移动的步长来结果输出矩阵的大小。

    下面的公式给出在同时使用全零填充时结果矩阵的大小:

    如果不使用填充:


    推荐阅读
    • 机器学习核心概念与技术
      本文系统梳理了机器学习的关键知识点,涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容,并深入探讨了各算法的原理和应用场景。 ... [详细]
    • Codeforces Round #566 (Div. 2) A~F个人题解
      Dashboard-CodeforcesRound#566(Div.2)-CodeforcesA.FillingShapes题意:给你一个的表格,你 ... [详细]
    • 卷积神经网络(CNN)基础理论与架构解析
      本文介绍了卷积神经网络(CNN)的基本概念、常见结构及其各层的功能。重点讨论了LeNet-5、AlexNet、ZFNet、VGGNet和ResNet等经典模型,并详细解释了输入层、卷积层、激活层、池化层和全连接层的工作原理及优化方法。 ... [详细]
    • 探索电路与系统的起源与发展
      本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
    • 尽管深度学习带来了广泛的应用前景,其训练通常需要强大的计算资源。然而,并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下(如ARM CPU)高效运行深度神经网络,特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]
    • 本题探讨了在大数据结构背景下,如何通过整体二分和CDQ分治等高级算法优化处理复杂的时间序列问题。题目设定包括节点数量、查询次数和权重限制,并详细分析了解决方案中的关键步骤。 ... [详细]
    • 智能车间调度研究进展
      本文综述了基于强化学习的智能车间调度策略,探讨了车间调度问题在资源有限条件下的优化方法。通过数学规划、智能算法和强化学习等手段,解决了作业车间、流水车间和加工车间中的静态与动态调度挑战。重点讨论了不同场景下的求解方法及其应用前景。 ... [详细]
    • 2018-2019学年第六周《Java数据结构与算法》学习总结
      本文总结了2018-2019学年第六周在《Java数据结构与算法》课程中的学习内容,重点介绍了非线性数据结构——树的相关知识及其应用。 ... [详细]
    • Coursera ML 机器学习
      2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]
    • 深入理解Java字符串池机制
      本文详细解析了Java中的字符串池(String Pool)机制,探讨其工作原理、实现方式及其对性能的影响。通过具体的代码示例和分析,帮助读者更好地理解和应用这一重要特性。 ... [详细]
    • 探讨ChatGPT在法律和版权方面的潜在风险及影响,分析其作为内容创造工具的合法性和合规性。 ... [详细]
    • 由中科院自动化所、中科院大学及南昌大学联合研究提出了一种新颖的双路径生成对抗网络(TP-GAN),该技术能通过单一侧面照片生成逼真的正面人脸图像,显著提升了不同姿态下的人脸识别效果。 ... [详细]
    • 2017年人工智能领域的十大里程碑事件回顾
      随着2018年的临近,我们一同回顾过去一年中人工智能领域的重要进展。这一年,无论是政策层面的支持,还是技术上的突破,都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]
    • 本文探讨了如何在发布 XenApp 应用时,通过命令行参数实现启动时的参数传递。特别介绍了静态和动态参数传递的方法,并详细解释了 ICA 文件中两种参数传递方式的区别及安全检查机制。 ... [详细]
    • Mongoose 5.12.10 发布:MongoDB 异步对象模型工具的新特性与修复
      Mongoose 是一款专为异步环境设计的 MongoDB 对象模型工具,支持 Promise 和回调函数。最新版本 Mongoose 5.12.10 带来了多项修复和改进,包括查询选项中的默认值设置、嵌入式判别器填充、以及 TypeScript 定义文件的优化。 ... [详细]
    author-avatar
    星仔star-powerbz
    这个家伙很懒,什么也没留下!
    PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
    Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有