SSD论文阅读

作者：mobiledu2502852497 | 来源：互联网 | 2023-07-16 14:15

Singleshot指明了SSD算法属于one-stage方法，MultiBox指明了SSD是多框预测参考图中给出了不同算法的基本框架图，对于Fast

在这里插入图片描述

Single shot指明了SSD算法属于one-stage方法&＃xff0c;MultiBox指明了SSD是多框预测

在这里插入图片描述

参考

图中给出了不同算法的基本框架图&＃xff0c;对于Faster R-CNN&＃xff0c;其先通过CNN得到候选框&＃xff0c;然后再进行分类与回归&＃xff0c;而Yolo与SSD可以一步到位完成检测。相比Yolo&＃xff0c;SSD采用CNN来直接进行检测&＃xff0c;而不是像Yolo那样在全连接层之后做检测。这&＃xff08;采用卷积直接做检测&＃xff09;只是SSD相比Yolo的其中一个不同点&＃xff0c;另外还有两个重要的改变&＃xff0c;一是SSD提取了不同尺度的特征图来做检测&＃xff0c;大尺度特征图&＃xff08;较靠前的特征图&＃xff09;可以用来检测小物体&＃xff0c; 而小尺度特征图&＃xff08;较靠后的特征图&＃xff09;用来检测大物体&＃xff1b;二是SSD采用了不同尺度和长宽比的先验框。Yolo算法缺点是难以检测小目标&＃xff0c;而且定位不准&＃xff0c;但是这几点重要改进使得SSD在一定程度上克服这些缺点。下面我们详细讲解SDD算法的原理。

在这里插入图片描述

输入一幅图片&＃xff08;300x300&＃xff09;&＃xff0c;将其输入到预训练好的分类网络中来获得不同大小的特征映射&＃xff0c;修改了传统的VGG16网络&＃xff1b;将VGG16的FC6和FC7层转化为卷积层&＃xff0c;如图1上的Conv6和Conv7&＃xff1b; 去掉所有的Dropout层和FC8层&＃xff1b; 添加了Atrous算法&＃xff08;hole算法&＃xff09;就是空洞卷积&＃xff1b; 【解释&＃xff1a;Atrous卷积&＃xff0c;就是带洞的卷积&＃xff0c;卷积核是稀疏的。】将Pool5从2x2-S2变换到3x3-S1&＃xff1b; 【解释&＃xff1a;】抽取Conv4_3、Conv7、Conv8_2、Conv9_2、Conv10_2、Conv11_2层的feature map&＃xff0c;然后分别在这些feature map层上面的每一个点构造6个不同尺度大小的bbox&＃xff0c;然后分别进行检测和分类&＃xff0c;生成多个bbox&＃xff0c;如P5中的图所示&＃xff1b;将不同feature map获得的bbox结合起来&＃xff0c;经过NMS&＃xff08;非极大值抑制&＃xff09;方法来抑制掉一部分重叠或者不正确的bbox&＃xff0c;生成最终的bbox集合&＃xff08;即检测结果&＃xff09;&＃xff1b;算法细节 &＃xff08;1&＃xff09;多尺度特征映射 SSD算法中使用到了conv4_3,conv_7&＃xff0c;conv8_2,conv7_2,conv8_2,conv9_2,conv10_2,conv11_2这些大小不同的feature maps&＃xff0c;目的是为了能够准确的检测到不同尺度的物体&＃xff0c;因为在低层的feature map,感受野比较小&＃xff0c;高层的感受野比较大&＃xff0c;在不同的feature map进行卷积&＃xff0c;可以达到多尺度的目的。&＃xff08;对上面那段话进行解释&＃xff0c;先不念&＃xff09;我们将一张图片输入到一个卷积神经网络中&＃xff0c;经历了多个卷积层和池化层&＃xff0c;我们可以看到在不同的卷积层会输出不同大小的feature map&＃xff08;这是由于pooling层的存在&＃xff0c;它会将图片的尺寸变小&＃xff09;&＃xff0c;而且不同的feature map中含有不同的特征&＃xff0c;而不同的特征可能对我们的检测有不同的作用。总的来说&＃xff0c;浅层卷积层对边缘更加感兴趣&＃xff0c;可以获得一些细节信息&＃xff0c;而深层网络对由浅层特征构成的复杂特征更感兴趣&＃xff0c;可以获得一些语义信息&＃xff0c;对于检测任务而言&＃xff0c;一幅图像中的目标有复杂的有简单的&＃xff0c;对于简单的patch&＃xff08;补丁&＃xff09;我们利用浅层网络的特征就可以将其检测出来&＃xff0c;对于复杂的patch我们利用深层网络的特征就可以将其检测出来&＃xff0c;因此&＃xff0c;如果我们同时在不同的feature map上面进行目标检测&＃xff0c;理论上面应该会获得更好的检测效果。原文链接&＃xff1a;https://blog.csdn.net/thisiszdy/article/details/89576389 &＃xff08;2&＃xff09;Defalut box

在这里插入图片描述

SSD中的Defalut box是预设一些目标预选框&＃xff0c;后续通过softmax分类&＃43;bounding box regression获得真实目标的位置。对于不同尺度的feature map 上使用不同的Default boxes。如图所示&＃xff0c;我们选取的feature map包括38x38x512、19x19x1024、10x10x512、5x5x256、3x3x256、1x1x256&＃xff0c;Conv4_3之后的feature map默认的box是4个&＃xff0c;我们在38x38的这个平面上的每一点上面获得4个box&＃xff0c;那么我们总共可以获得38x38x4&＃61;5776个&＃xff1b; 同理&＃xff0c;我们依次将FC7、Conv8_2、Conv9_2、Conv10_2和Conv11_2的box数量设置为6、6、6、4、4&＃xff0c;那么我们可以获得的box分别为2166、600、150、36、4&＃xff0c;即我们总共可以获得8732个box&＃xff0c;然后我们将这些box送入NMS模块中&＃xff0c;获得最终的检测结果。

在这里插入图片描述

公式1中的sk表示先验框大小相对于图片的比例公式2中的ar就是[1, 2, 3, 1/2, 1/3]

在这里插入图片描述

&＃xff08;上表&＃xff09;首先整体看一下SSD在VOC2007&＃xff0c;VOC2012及COCO数据集上的性能。相比之下&＃xff0c;SSD512的性能会更好一些。加*的表示使用了image expansion data augmentation&＃xff08;通过zoom out来创造小的训练样本&＃xff09;技巧来提升SSD在小目标上的检测效果&＃xff0c;所以性能会有所提升。&＃xff08;下表&＃xff09;基本可以看到&＃xff0c;SSD与Faster R-CNN有同样的准确度&＃xff0c;并且与Yolo具有同样较快地检测速度。

在这里插入图片描述

&＃xff08;上表&＃xff09;作者的验证方法是&＃xff1a;逐渐移除1:3,1:2的初始框&＃xff0c;观察模型的表现效果。得出结论: 数据扩增技术很重要&＃xff0c;对于mAP的提升很大&＃xff1b; 使用不同长宽比的先验框可以得到更好的结果&＃xff1b;

在这里插入图片描述

推荐阅读

io
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
io
ICRA2019最佳论文 Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio

文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议：ICRA2019标题：《MakingSenseofVision ... [详细]

蜡笔小新 2023-10-17 12:49:25
io
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
io
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
io
Android开发笔记：使用Picasso加载网络图片等比例缩放

在Android开发中，使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法，并提供了具体的代码实现。通过获取图片的宽高，计算目标宽度和高度，并创建新图实现等比例缩放。 ... [详细]

蜡笔小新 2023-12-14 17:34:00
io
Android 新闻App的本地服务器搭建教程

本文介绍了在开发Android新闻App时，搭建本地服务器的步骤。通过使用XAMPP软件，可以一键式搭建起开发环境，包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表，并设置相应的属性。最后，给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]

蜡笔小新 2023-12-14 17:15:19
io
cs231n Lecture 3 线性分类笔记（一）

内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注：中文翻译 ... [详细]

蜡笔小新 2023-10-17 19:40:56
join
Opencv Python版学习笔记（八）字符识别-分类器（SVM，KNearest，RTrees，Boost，MLP）

Opencv提供了几种分类器，例程里通过字符识别来进行说明的1、支持向量机（SVM）：给定训练样本，支持向量机建立一个超平面作为决策平面，使得正例和反例之间的隔离边缘被最大化。函数原型：训练原型cv ... [详细]

蜡笔小新 2023-10-17 17:02:44
jsp
3年半巨亏242亿！商汤高估了深度学习，下错了棋？

转自：新智元三年半研发开支近70亿，累计亏损242亿。AI这门生意好像越来越不好做了。近日，商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]

蜡笔小新 2023-10-17 16:41:52
io
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
io
Windows7 安装TensorflowGPU文档

安装Tensorflow-GPU文档第一步：通过Anaconda安装python从这个链接https:www.anaconda.comdownload#window ... [详细]

蜡笔小新 2023-10-17 07:23:13
io
程度|也就是_论文精读：Neural Architecture Search without Training

篇首语：本文由编程笔记#小编为大家整理，主要介绍了论文精读：NeuralArchitectureSearchwithoutTraining相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-16 16:33:20
python
fasttext整体介绍

Word2vec,Fasttext,Glove,Elmo,Bert,Flairpre-trainWordEmbedding源码数据Github网址:词向量预训练实现Githubf ... [详细]

蜡笔小新 2023-10-16 12:14:34
io
论文阅读：《Bag of Tricks for LongTailed Visual Recognition with Deep Convolutional Neural Networks》

基于深度卷积神经网络的长尾视觉识别技巧包摘要近年来，挑战性长尾分布上的视觉识别技术取得了很大的进展，主要基于各种复杂的范式(如元学习)。除了这些复杂 ... [详细]

蜡笔小新 2023-10-16 11:18:28
io
基于STM32的智能循迹小车设计（基础版）

基于STM32的智能循迹小车设计（基础版）硬件准备1、小车底盘+四直流电机（带轮）2、STM32F103C8T6核心板3、12V8700mAh锂电池（可以用几节18650锂电池）4 ... [详细]

蜡笔小新 2023-10-16 10:39:17

mobiledu2502852497

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章