本文的核心思想是将深度可分离卷积和不同的空洞率的空洞卷积相结合,设计了一个空洞可分离卷积模块,在减少模型的计算量的同时,能够更高效的提取特征。
在网络的输出端加入了通道注意力和空间注意力模块,增强对特征的通道信息和空间信息的表达并与原始特征融合,进一步提高特征的表达能力。
本文的主要工作可以概括为:1)结合深度可分离卷积和不同大小空洞率的空洞卷积模块,这样做的目的是为了有效获取不同大小的感受野信息,并且可以在减少模型计算量的同时,可以更高效的提取特征
2)在网络的输出端,先引入通道注意力模块,获取不同的特征通道之间的重要性,再采用级联的方式将其与空间注意力模块进行结合。增强了特征的空间信息和通道信息的表达,并与原始特征融合进一步提高对特征的表达能力。
方法
本文的网络结构主要由两步方组成:特征提取阶段和特征增强阶段。
特征提取阶段由下采样,空洞可分离卷积模块组成。而特征增强阶段由通道注意力模块,空间注意力模块,全局平均池化和上采样组成。
在特征提取阶段使用本文提出的空洞可分离卷积代替标注卷积以此减少参数量,并在每个分支的卷积层使用不同空洞率的空洞卷积扩大感受野,有效获取多尺度上下文信息。
而在特征增强阶段是对提取的特征进行重新整合,增强特征的信息表达。
整体架构示意图如下:
本文空洞可分离卷积采用双分支结构,并且在每个分支结构结合了不同大小空洞率的空洞卷积,有效的获取了多尺度信息,如下图所示
具体来说使用通道分离操作将通道数分为原来的一半,分成两个分支。针对每个分支采用一组可分离卷积代替标注卷积来减少参数量。
并且为了同时获得多尺度信息所以在每个分支上的卷积层使用不同大小空洞率的空洞卷积来扩大感受野,从而有效的获取多尺度信息。在第 1个分支采用空洞率为 D1的空洞卷积,在第 2个分支采用空洞率为 D2的空洞卷积。然后使用Contact操作将两个分支进行合并,恢复原有的通道数。最后使用1*1卷积促进融合两个分支之间的信息,增强特征表达,并将输入特征和两个分支融合的特征进行残差连接。
通道注意力模块可以获取特征图不同通道间的重要程度,并赋予每个通道相应的权重,通道注意力模块如下图所示:
首先,对于输入的特征图 F,在空间维度上使用平均池化和最大池化操作提取空间和通道权重,得到两个不同的特征描述,分别表示平均池化特征和最大池化特征。然后,将两个描述特征送到多层感知,将MLP的输出特征进行融合操作。
最后经过Sigmod激活函数生成通道注意力特征图,将注意力特征图和输入特征图相乘得到具有通道关注的特征图。
采用的空间注意力模块如下图
首先,对经过通道注意力模块得到的特征图 Fc,在通道维度上进行平均池化和最大池化,得到两个
不同信息表示的特征图。其次,使用 concat操作将这两个不同表示的特征图进行直接拼接,再使用大小为7 × 7的卷积层进行卷积,再经过 sigmoid激活函数得到空间注意力特征图。最后,将 Fss与输入特征 Fc相乘即可得到具有空间关注的特征图 Fs
总结:基于考虑到多尺度信息的
获取,本文方法将深度可分离卷积与不同空洞率的空洞卷积有效结合,在每个深度可分离卷积分支上
采用不同空洞率的空洞卷积获取不同大小的感受野,并且引入通道注意力模块和空间注意力模块,增
强特征的表达。