热门标签 | HotTags
当前位置:  开发笔记 > 开发工具 > 正文

SEPC论文阅读

题目:用于目标检测的金字塔尺度均衡卷积(简称SEPC)图像处理基础总结跨尺度相关性尺度不变性:就是我们在描述一个特征之前&

在这里插入图片描述

题目:用于目标检测的金字塔尺度均衡卷积(简称SEPC)

在这里插入图片描述

在这里插入图片描述
图像处理基础总结
跨尺度相关性
在这里插入图片描述

尺度不变性:就是我们在描述一个特征之前,将两张图像都变换到同一个尺度上,然后再在这个统一标准上来描述这个特征。(为了实现尺度不变性,需要给特征加上尺度因子。在进行特征描述的时候,将尺度统一就可以实现尺度不变性了。)
注:尺度不变就是在特征点提取,或者匹配的时候,永远都把握好他就是那么大的存在,不会因为缩放把它变形。SIFT:尺度不变特征转换,用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量深度神经网络中特征金字塔与高斯金字塔的区别:
高斯金字塔可应用在深度神经网络上面,但是由于它需要大量的运算和大量的内存。但是我们的特征金字塔可以在速度和准确率之间进行权衡,可以通过它获得更加鲁棒的语义信息。尺度不变特征变换(SIFT)匹配算法详解:
https://blog.csdn.net/memray/article/details/39234645

在这里插入图片描述
在这里插入图片描述

RetinaNet:2017 CVPR
Subnet:子网络(紧接着第6页PPT下面的话)但是实际使用中,我们经常观察到不同尺度的物体相互竞争,
使得检测器在不同尺度的性能此高彼低的现象,这些情况不太符合尺度等变特性,这是为什么呢?(见P7中的分析)

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

(本页先说)考虑到FPN的不同层的分辨率不同(不同pyramid level的特征图大小是不同的),我们由此提出金字塔卷积(Pconv)的结构(接着改页最下面的那句话)实际上是一个跨越尺度和空间维度的三维卷积。如果将每一层的特征表示为1个点,如图a所示,金字塔卷积可以表示为N个不同的2D卷积。
不同的金字塔水平上存在大小的不匹配,空间大小随着金字塔水平的上升而缩小,为了适应这种不匹配,在不同层卷积时,对K个不同的内核设置了不同的步长。

在这里插入图片描述

(对右上角图的解释)金字塔卷积为3-D卷积。三个卷积核(红色,黄色和青色)用于此3-D卷积。
每个内核的卷积步幅随特征图的大小而缩放。框架颜色相同的要素图(例如 蓝色和粉红色)在相同框架颜色的右侧生成特征图。该图像仅用于显示比例,不表示特征图不同pyramid level的特征图大小是不同的,为了容纳不同的尺寸,在PConv在处理不同的特征图时使用不同的stride,论文采样N=3,首个卷积核的stride为2,最小的的卷积核的stride为0.5。对公式1的解释:PConv可以表示为公式(1),w1,w0,w-13个独立的2-D卷积核,x为输入的特征图,*s2代表stride为2的卷积核。对公式2的解释:stride为0.5的卷积核先对特征图双线性上采样2倍,再用stride为1的卷积核进行处理。PConv也使用zero-padding,对于底层和顶层的pyramid level仅需使用公式2的其中两项即可,PConv的计算量大约为原始FPN的1.5倍。(对上面两张图的一个分析)用特征金字塔相邻三层(P3,P4,P5)举例,在P3上利用stride为2的conv进行卷积,在P4上利用普通conv卷积,P5上普通conv卷积然后upsample,
得到相同大小的特征图然后相加,不难推导,其等效于在特征图上每一点在HW维度卷积后再在尺度空间(P3,P4,P5)进行一次卷积,因此其相当于一个3-D的卷积核。(结合左图的FPN)

在这里插入图片描述

(a)最初的RetinaNet的头部设计;(b)PConv的头部设计。在最终的输出卷积中,
K是锚定框的数量,对于无锚定方法,它是1,而C是分类中的类数。

在这里插入图片描述
在这里插入图片描述

(提出SEPC的原因,可不说)PConv对于不同的level都使用固定的卷积核大小,在高斯金字塔上(模糊程度不严重且高斯核接近特征图缩放比例),PConv能够提取尺度不变的特征。
(提出SEPC的原因,可不说)但实际中,由于多层卷积和非线性操作的存在,特征金字塔的模糊程度比高斯金字塔要严重得多
(特征的缩放程度可能跟特征图大小不成比例),使用固定的卷积核大小很难提取尺度不变的特征。高斯模糊是一种图像滤波器,它使用正态分布(高斯函数)计算模糊模板,并使用该模板与原图像做卷积运算,达到模糊图像的目的

在这里插入图片描述

SEPC分为两个版本,SEPC-full对P11页图b的Combined head和Extra head加入SEPC,而SEPC-lite则仅对Extra head加入SEPC。我们做了详尽的消融实验,以确保我们每个模块的有效性.我们选取了FSAF,RetinaNet,FreeAnchor三个有代表性的model验证我们的有效性。如表中所示
可以看到,我们提出的模块在三个model上均有稳定的提升,并且性能提升相比flops与forward速度的增加极具性价比,值得注意的是,虽然我们使用了Dconv,但是性能的提升不仅仅是Dconv带来的,相比head结构全部更换为Dconv,我们的SEPC在速度与性能上都体现出了绝对的优势。
Dconv:可变形卷积

在这里插入图片描述

同时我们选取了FreeAnchor为基础与当前SOTA检测器进行了比较。如表中所示
我们SEPC在mAP45左右的baseline上依然有接近3mAP的提升,
我们在甚至在单尺度测试的条件下得到了一个mAP为50.1的单阶段检测器。

在这里插入图片描述
FPN详解

在这里插入图片描述


推荐阅读
  • 使用R语言进行Foodmart数据的关联规则分析与可视化
    本文探讨了如何利用R语言中的arules和arulesViz包对Foodmart数据集进行关联规则的挖掘与可视化。文章首先介绍了数据集的基本情况,然后逐步展示了如何进行数据预处理、规则挖掘及结果的图形化呈现。 ... [详细]
  • 分布式计算助力链力实现毫秒级安全响应,确保100%数据准确性
    随着分布式计算技术的发展,其在数据存储、文件传输、在线视频、社交平台及去中心化金融等多个领域的应用日益广泛。国际知名企业如Firefox、Google、Opera、Netflix、OpenBazaar等均已采用该技术,推动了技术创新和服务升级。 ... [详细]
  • 探索CNN的可视化技术
    神经网络的可视化在理论学习与实践应用中扮演着至关重要的角色。本文深入探讨了三种有效的CNN(卷积神经网络)可视化方法,旨在帮助读者更好地理解和优化模型。 ... [详细]
  • 本文探讨了在AspNetForums平台中实施基于角色的权限控制系统的方法,旨在为不同级别的用户提供合适的访问权限,确保系统的安全性和可用性。 ... [详细]
  • Excel技巧:单元格中显示公式而非结果的解决方法
    本文探讨了在Excel中如何通过简单的方法解决单元格显示公式而非计算结果的问题,包括使用快捷键和调整单元格格式两种方法。 ... [详细]
  • 本文旨在探讨Swift中的Closure与Objective-C中的Block之间的区别与联系,通过定义、使用方式以及外部变量捕获等方面的比较,帮助开发者更好地理解这两种机制的特点及应用场景。 ... [详细]
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • 本文将深入探讨 Unreal Engine 4 (UE4) 中的距离场技术,包括其原理、实现细节以及在渲染中的应用。距离场技术在现代游戏引擎中用于提高光照和阴影的效果,尤其是在处理复杂几何形状时。文章将结合具体代码示例,帮助读者更好地理解和应用这一技术。 ... [详细]
  • 微软等企业捐赠首批AI有声读物,助力视障人士
    12月2日,微软联合鹿音苑文化传播公司及150多名志愿者,共同捐赠了首批由人工智能生成的有声内容,旨在为视障人士提供更多文化资源。 ... [详细]
  • LeetCode 实战:寻找三数之和为零的组合
    给定一个包含 n 个整数的数组,判断该数组中是否存在三个元素 a、b、c,使得 a + b + c = 0。找出所有满足条件且不重复的三元组。 ... [详细]
  • 短暂的人生中,IT和技术只是其中的一部分。无论换工作还是换行业,最终的目标是成功、荣誉和收获。本文探讨了技术人员如何跳出纯技术的局限,实现更大的职业发展。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 探索将Python Spyder与GitHub连接的方法,了解当前的技术状态及未来可能的发展方向。 ... [详细]
  • 我整理了HMOV四大5G旗舰的参数,可依然没能拯救我的选择困难症
    伊瓢茕茕发自凹非寺量子位报道|公众号QbitAI报道了那么多发布会,依然无法选出要换的第一部5G手机。这不,随着华为P40系列发布,目前国 ... [详细]
  • 如何寻找程序员的兼职机会
    随着远程工作的兴起,越来越多的程序员开始寻找灵活的兼职工作机会。本文将介绍几个适合程序员、设计师、翻译等专业人士的在线平台,帮助他们找到合适的兼职项目。 ... [详细]
author-avatar
手机用户2502911627_202
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有