热门标签 | HotTags
当前位置:  开发笔记 > 开发工具 > 正文

SEPC论文阅读

题目:用于目标检测的金字塔尺度均衡卷积(简称SEPC)图像处理基础总结跨尺度相关性尺度不变性:就是我们在描述一个特征之前&

在这里插入图片描述

题目:用于目标检测的金字塔尺度均衡卷积(简称SEPC)

在这里插入图片描述

在这里插入图片描述
图像处理基础总结
跨尺度相关性
在这里插入图片描述

尺度不变性:就是我们在描述一个特征之前,将两张图像都变换到同一个尺度上,然后再在这个统一标准上来描述这个特征。(为了实现尺度不变性,需要给特征加上尺度因子。在进行特征描述的时候,将尺度统一就可以实现尺度不变性了。)
注:尺度不变就是在特征点提取,或者匹配的时候,永远都把握好他就是那么大的存在,不会因为缩放把它变形。SIFT:尺度不变特征转换,用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量深度神经网络中特征金字塔与高斯金字塔的区别:
高斯金字塔可应用在深度神经网络上面,但是由于它需要大量的运算和大量的内存。但是我们的特征金字塔可以在速度和准确率之间进行权衡,可以通过它获得更加鲁棒的语义信息。尺度不变特征变换(SIFT)匹配算法详解:
https://blog.csdn.net/memray/article/details/39234645

在这里插入图片描述
在这里插入图片描述

RetinaNet:2017 CVPR
Subnet:子网络(紧接着第6页PPT下面的话)但是实际使用中,我们经常观察到不同尺度的物体相互竞争,
使得检测器在不同尺度的性能此高彼低的现象,这些情况不太符合尺度等变特性,这是为什么呢?(见P7中的分析)

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

(本页先说)考虑到FPN的不同层的分辨率不同(不同pyramid level的特征图大小是不同的),我们由此提出金字塔卷积(Pconv)的结构(接着改页最下面的那句话)实际上是一个跨越尺度和空间维度的三维卷积。如果将每一层的特征表示为1个点,如图a所示,金字塔卷积可以表示为N个不同的2D卷积。
不同的金字塔水平上存在大小的不匹配,空间大小随着金字塔水平的上升而缩小,为了适应这种不匹配,在不同层卷积时,对K个不同的内核设置了不同的步长。

在这里插入图片描述

(对右上角图的解释)金字塔卷积为3-D卷积。三个卷积核(红色,黄色和青色)用于此3-D卷积。
每个内核的卷积步幅随特征图的大小而缩放。框架颜色相同的要素图(例如 蓝色和粉红色)在相同框架颜色的右侧生成特征图。该图像仅用于显示比例,不表示特征图不同pyramid level的特征图大小是不同的,为了容纳不同的尺寸,在PConv在处理不同的特征图时使用不同的stride,论文采样N=3,首个卷积核的stride为2,最小的的卷积核的stride为0.5。对公式1的解释:PConv可以表示为公式(1),w1,w0,w-13个独立的2-D卷积核,x为输入的特征图,*s2代表stride为2的卷积核。对公式2的解释:stride为0.5的卷积核先对特征图双线性上采样2倍,再用stride为1的卷积核进行处理。PConv也使用zero-padding,对于底层和顶层的pyramid level仅需使用公式2的其中两项即可,PConv的计算量大约为原始FPN的1.5倍。(对上面两张图的一个分析)用特征金字塔相邻三层(P3,P4,P5)举例,在P3上利用stride为2的conv进行卷积,在P4上利用普通conv卷积,P5上普通conv卷积然后upsample,
得到相同大小的特征图然后相加,不难推导,其等效于在特征图上每一点在HW维度卷积后再在尺度空间(P3,P4,P5)进行一次卷积,因此其相当于一个3-D的卷积核。(结合左图的FPN)

在这里插入图片描述

(a)最初的RetinaNet的头部设计;(b)PConv的头部设计。在最终的输出卷积中,
K是锚定框的数量,对于无锚定方法,它是1,而C是分类中的类数。

在这里插入图片描述
在这里插入图片描述

(提出SEPC的原因,可不说)PConv对于不同的level都使用固定的卷积核大小,在高斯金字塔上(模糊程度不严重且高斯核接近特征图缩放比例),PConv能够提取尺度不变的特征。
(提出SEPC的原因,可不说)但实际中,由于多层卷积和非线性操作的存在,特征金字塔的模糊程度比高斯金字塔要严重得多
(特征的缩放程度可能跟特征图大小不成比例),使用固定的卷积核大小很难提取尺度不变的特征。高斯模糊是一种图像滤波器,它使用正态分布(高斯函数)计算模糊模板,并使用该模板与原图像做卷积运算,达到模糊图像的目的

在这里插入图片描述

SEPC分为两个版本,SEPC-full对P11页图b的Combined head和Extra head加入SEPC,而SEPC-lite则仅对Extra head加入SEPC。我们做了详尽的消融实验,以确保我们每个模块的有效性.我们选取了FSAF,RetinaNet,FreeAnchor三个有代表性的model验证我们的有效性。如表中所示
可以看到,我们提出的模块在三个model上均有稳定的提升,并且性能提升相比flops与forward速度的增加极具性价比,值得注意的是,虽然我们使用了Dconv,但是性能的提升不仅仅是Dconv带来的,相比head结构全部更换为Dconv,我们的SEPC在速度与性能上都体现出了绝对的优势。
Dconv:可变形卷积

在这里插入图片描述

同时我们选取了FreeAnchor为基础与当前SOTA检测器进行了比较。如表中所示
我们SEPC在mAP45左右的baseline上依然有接近3mAP的提升,
我们在甚至在单尺度测试的条件下得到了一个mAP为50.1的单阶段检测器。

在这里插入图片描述
FPN详解

在这里插入图片描述


推荐阅读
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 自学编程与计算机专业背景者的差异分析
    本文探讨了自学编程者和计算机专业毕业生在技能、知识结构及职业发展上的不同之处,结合实际案例分析两者的优势与劣势。 ... [详细]
  • 尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络(RNN)的门槛,但对于初学者来说,理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理(NLP)的RNN模型。 ... [详细]
  • 信用评分卡的Python实现与评估
    本文介绍如何使用Python构建和评估信用评分卡模型,涵盖数据预处理、模型训练及验证指标选择。附带详细代码示例和视频教程链接。 ... [详细]
  • 卷积神经网络(CNN)基础理论与架构解析
    本文介绍了卷积神经网络(CNN)的基本概念、常见结构及其各层的功能。重点讨论了LeNet-5、AlexNet、ZFNet、VGGNet和ResNet等经典模型,并详细解释了输入层、卷积层、激活层、池化层和全连接层的工作原理及优化方法。 ... [详细]
  • 探索电路与系统的起源与发展
    本文回顾了电路与系统的发展历程,从电的早期发现到现代电子器件的应用。文章不仅涵盖了基础理论和关键发明,还探讨了这一学科对计算机、人工智能及物联网等领域的深远影响。 ... [详细]
  • 本文作者分享了在阿里巴巴获得实习offer的经历,包括五轮面试的详细内容和经验总结。其中四轮为技术面试,一轮为HR面试,涵盖了大量的Java技术和项目实践经验。 ... [详细]
  • 智能车间调度研究进展
    本文综述了基于强化学习的智能车间调度策略,探讨了车间调度问题在资源有限条件下的优化方法。通过数学规划、智能算法和强化学习等手段,解决了作业车间、流水车间和加工车间中的静态与动态调度挑战。重点讨论了不同场景下的求解方法及其应用前景。 ... [详细]
  • Coursera ML 机器学习
    2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]
  • 机器学习核心概念与技术
    本文系统梳理了机器学习的关键知识点,涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容,并深入探讨了各算法的原理和应用场景。 ... [详细]
  • JavaScript中的数组是数据集合的核心结构之一,内置了多种实用的方法。掌握这些方法不仅能提高开发效率,还能显著提升代码的质量和可读性。本文将详细介绍数组的创建方式及常见操作方法。 ... [详细]
  • 程序员如何优雅应对35岁职业转型?这里有深度解析
    本文探讨了程序员在职业生涯中如何通过不断学习和技能提升,优雅地应对35岁左右的职业转型挑战。我们将深入分析当前热门技术趋势,并提供实用的学习路径。 ... [详细]
  • 由中科院自动化所、中科院大学及南昌大学联合研究提出了一种新颖的双路径生成对抗网络(TP-GAN),该技术能通过单一侧面照片生成逼真的正面人脸图像,显著提升了不同姿态下的人脸识别效果。 ... [详细]
  • 本文档汇总了Python编程的基础与高级面试题目,涵盖语言特性、数据结构、算法以及Web开发等多个方面,旨在帮助开发者全面掌握Python核心知识。 ... [详细]
  • 2017年人工智能领域的十大里程碑事件回顾
    随着2018年的临近,我们一同回顾过去一年中人工智能领域的重要进展。这一年,无论是政策层面的支持,还是技术上的突破,都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]
author-avatar
手机用户2502911627_202
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有