热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

深度学习——PoolingLayer

深度学习——PoolingLayer简介PoolingLayer正常是用于ConvolutionLayer后面,可以进一步提取有效特征,降低nW,n
深度学习——Pooling Layer

简介


  • Pooling Layer正常是用于Convolution Layer后面,可以进一步提取有效特征,降低nW,nHn_W,n_HnW,nH维度,减少计算量。Pooling 层和Convolution层一样具有stride(d)、f、pad(p)stride(d)、f、pad(p)stride(d)fpad(p)参数。
  • Pooling Layer主要有两种:1)Max Pooling、2)Average Pooling,如下图(1)
  • nHl=⌊nHl−1+2∗p−fs+1⌋,nWl=⌊nWl−1+2∗p−fs+1⌋,nCl=nCl−1(1)n_H^l=\lfloor \frac{n_H^{l-1}+2*p-f}{s}+1\rfloor,n_W^l=\lfloor \frac{n_W^{l-1}+2*p-f}{s}+1\rfloor,n_C^{l}=n_C^{l-1} \qquad(1)nHl=snHl1+2pf+1,nWl=snWl1+2pf+1,nCl=nCl1(1)
    在这里插入图片描述
    figure(1)figure(1)figure(1)

1、Max Pooling


forwardpropagation


  • Max Pooling如上图(1)所示,对输入数据每一通道在f*f 的slice范围内的数取最大值形成新的矩阵,最后每一通的矩阵concat在一起,维度变为公式(1)。f=2,stride=2f =2,stride =2f=2,stride=2
    a(nh,nw,c)l=max(a(nh∗stride:nh∗stride+f,nw∗stride:nw∗stride+f,c)l−1)(2)a_{(nh,nw,c)}^l=max(a^{l-1}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)})\qquad(2)a(nh,nw,c)l=max(a(nhstride:nhstride+f,nwstride:nwstride+f,c)l1)(2)

backpropagation


  • 由前向传播可以知道,梯度只要最大值才有,只有最大值才需更新。
    mask=(a(nh∗stride:nh∗stride+f,nw∗stride:nw∗stride+f,c)l−1==max)//等于最大值的位置变为1,其他为0(3)mask = (a^{l-1}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)}==max)//等于最大值的位置变为1,其他为0 \qquad(3)mask=(a(nhstride:nhstride+f,nwstride:nwstride+f,c)l1==max)//1,0(3)
    dA(nh∗stride:nh∗stride+f,nw∗stride:nw∗stride+f,c)l−1+=mask∗dA(nw,nh,nc)l(4)dA^{l-1}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)} +=mask*dA^l_{(nw,nh,nc)}(4)dA(nhstride:nhstride+f,nwstride:nwstride+f,c)l1+=maskdA(nw,nh,nc)l(4)

2、Average Pooling


forwardpropagation


  • Average Pooling如上图(1)所示,对输入数据每一通道在f*f 的slice范围内的数计算平均值形成新的矩阵,最后每一通的矩阵concat在一起,维度变为公式(1)。f=2,stride=2f =2,stride =2f=2,stride=2
    a(nh,nw,c)l=np.sum(a(nh∗stride:nh∗stride+f,nw∗stride:nw∗stride+f,c)l−1)f∗f(5)a_{(nh,nw,c)}^l=\frac{np.sum(a^{l-1}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)})}{f*f}\qquad(5)a(nh,nw,c)l=ffnp.sum(a(nhstride:nhstride+f,nwstride:nwstride+f,c)l1)(5)

backpropagation


  • 由前向传播可以知道
    dAverage(nh∗stride:nh∗stride+f,nw∗stride:nw∗stride+f,c)l=np.sum(dAverage(nh∗stride:nh∗stride+f,nw∗stride:nw∗stride+f,c)l−1)f∗fdAverage^{l}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)}=\frac{np.sum(dAverage^{l-1}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)})}{f*f}dAverage(nhstride:nhstride+f,nwstride:nwstride+f,c)l=ffnp.sum(dAverage(nhstride:nhstride+f,nwstride:nwstride+f,c)l1)
    dA((nh∗stride:nh∗stride+f,nw∗stride:nw∗stride+f,c)l−1+=dAverage(nh∗stride:nh∗stride+f,nw∗stride:nw∗stride+f,c)l(4)dA^{l-1}_{((nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)} += dAverage^{l}_{(nh*stride:nh*stride+f,nw*stride:nw*stride+f,c)} (4)dA((nhstride:nhstride+f,nwstride:nwstride+f,c)l1+=dAverage(nhstride:nhstride+f,nwstride:nwstride+f,c)l(4)

推荐阅读
author-avatar
晴子suerw_980
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有