热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

分组卷积计算量_分解卷积的一些方法

目录depth-wiseconvgourpconvchannel-wiseconv传统卷积中,假设输入通道数n,大小,输出通道数m
2efb5a41f93c45ad1ccd4bde79962580.png

目录

  • depth-wise conv
  • gourp conv
  • channel-wise conv

传统卷积中,假设输入通道数n,大小

,输出通道数m,卷积核大小
,步长为1的情况下,计算量为
,参数量为
,造成的计算量和参数量非常大。因此衍生出一些用于降低模型大小和计算量的方法,本文对其中三个方法进行简单介绍。

depth-wise convolution

MobileNets是为移动设备设计的网络,该模型的核心是名为depth-wise separable convolution的卷积层。它将传统卷积分解为一个depth-wise convolution和一个1x1卷积。

6fd76bcba775e2af35b87105d7ad211b.png

对一个大小为

的输入图,传统的方法是使用大小为
的卷积核进行卷积。

而depth-wise separable convolution则首先使用大小为

的卷积核进行depth-wise convolution。具体来说,在depth-wise convolution中,n个输入通道中的每一个都有相应的卷积核,两两进行卷积。得到的输出通道数为n,如果stride为1且padding为same的话,大小就是

接下来再进行1x1卷积,卷积核为

,得到
的最终输出。

这种方法的计算量为

,参数大小为

可以发现参数量和计算量都大幅下降。

但是可以发现仍然没有规避一个巨大的

,在现代网络通道数动辄512、1024的情况下,仍然有优化余地。

group convolution

group convolution的历史就比较早了,在AlexNet中就有。

f9ddc0a7d721ac5fa6c2849e66f81686.png

group convolution就是把输入特征图分为g组,然后将这g个组分别进行卷积。道理很简单。

我们假设输入通道数和输出通道数都能被g整除,那么计算量就是

,参数量是

group convolution的缺点是,每个group之间的特征不进行交换,会造成性能下降。

后面有ShuffleNet对group convolution进行改进,就是在卷积完成后加入一个channel shuffle。我看其他人写的材料称之为“均匀地打乱”,这样接下来进行group convolution时,每一个group的输入不是只来自相邻组,这样就实现了特征融合。

73c4645f579a19e77d5092703817d6c1.png

channel-wise convolution

近日阅读paper,发现一个

的式子用在动态生成卷积核的简化上。 说
代表channel-wise convolution。查资料看到一篇18年的paper定义了它,但是写得有点晦涩,中文网络反而没有其他解释。因此在对paper进行努力阅读理解的过程中写了这些东西。

首先我们从特例开始。输入

大小的特征图,输出通道为m。那么输入可以平铺为
(假设
为整数)。此时channel-wise convolution就是对这个平铺的特征图的普通1x1卷积。
b7f2aa73acf86e935459755e0ac06df0.png
特例时的channel wise convolution,深色部位代表卷积核窗口

当输入特征图大小不为1时,卷积核就在channel维度上移动,卷积核窗口内每一个元素都落在不同channel的相同位置上。下图展示的是通道数n=9,输入宽度为2的输入特征图,大小为4的卷积核在上面滑动。

4f0eaa8f99500803cfb2151ab200cfc8.png
非特例时的channel-wise convolution

channel-wise convolution的卷积核为公用的,大小为

的卷积核,代表着参数量也仅为
。它的计算量为
,规避了 巨大的
,效率比较高。

参考文献

  1. Gao, Hongyang, Zhengyang Wang, and Shuiwang Ji. "ChannelNets: Compact and efficient convolutional neural networks via channel-wise convolutions."Advances in Neural Information Processing Systems. 2018.
  2. "MobileNets." 机器之心, 23 Feb. 2020, MobileNets.
  3. "CNN模型之ShuffleNet." 知乎专栏, 23 Feb. 2020, 小小将:CNN模型之ShuffleNet.
  4. "Group Convolution分组卷积,以及Depthwise Convolution和Global Depthwise Convolution - shine-lee - 博客园." 23 Feb. 2020, Group Convolution分组卷积,以及Depthwise Convolution和Global Depthwise Convolution.



推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • 本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置,但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置,并列出了出现的错误信息。 ... [详细]
  • 推荐系统遇上深度学习(十七)详解推荐系统中的常用评测指标
    原创:石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值, ... [详细]
  • 怀疑是每次都在新建文件,具体代码如下 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • Tomcat/Jetty为何选择扩展线程池而不是使用JDK原生线程池?
    本文探讨了Tomcat和Jetty选择扩展线程池而不是使用JDK原生线程池的原因。通过比较IO密集型任务和CPU密集型任务的特点,解释了为何Tomcat和Jetty需要扩展线程池来提高并发度和任务处理速度。同时,介绍了JDK原生线程池的工作流程。 ... [详细]
  • 本文讨论了clone的fork与pthread_create创建线程的不同之处。进程是一个指令执行流及其执行环境,其执行环境是一个系统资源的集合。在调用系统调用fork创建一个进程时,子进程只是完全复制父进程的资源,这样得到的子进程独立于父进程,具有良好的并发性。但是二者之间的通讯需要通过专门的通讯机制,另外通过fork创建子进程系统开销很大。因此,在某些情况下,使用clone或pthread_create创建线程可能更加高效。 ... [详细]
  • 深入理解Kafka服务端请求队列中请求的处理
    本文深入分析了Kafka服务端请求队列中请求的处理过程,详细介绍了请求的封装和放入请求队列的过程,以及处理请求的线程池的创建和容量设置。通过场景分析、图示说明和源码分析,帮助读者更好地理解Kafka服务端的工作原理。 ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了logistic回归(线性和非线性)相关的知识,包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]
  • 本文介绍了brain的意思、读音、翻译、用法、发音、词组、同反义词等内容,以及脑新东方在线英语词典的相关信息。还包括了brain的词汇搭配、形容词和名词的用法,以及与brain相关的短语和词组。此外,还介绍了与brain相关的医学术语和智囊团等相关内容。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景,描述了学童们面对老先生的教导时的反应,以及上官如在这个过程中的表现。同时,文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后,文章强调了日期和时区操作在机器学习中的重要性,并指出了其在实际应用中的作用和意义。 ... [详细]
author-avatar
广佛笑嘻嘻_229
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有