热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【目标检测】ScaleAwareTridentNetworksforObjectDetection阅读笔记

Scale-Aware Trident Networks for Object Detection

1.Introduce

该文章通过提出TridentNet,来生成具有统一表征能力的特定尺度特征图,以此解决目标检测中尺度多变问题。其中,作者建立了一个并行多分支结构,它们共享参数,但感受野不同。作者采用Resnet-101作为骨架网络。

2.Relate work

【目标检测】Scale-Aware Trident Networks for Object Detection 阅读笔记

其中目前目标检测的四种方法如下图所示,分别为:

【目标检测】Scale-Aware Trident Networks for Object Detection 阅读笔记

对应下来是:

  1. 图像金字塔 ,利用不同尺度的图像生成不同尺度的特征图,再去分别做预测。
  2. SPPnet, Fast RCNN,Faster RCNN等仅采用网络的最后一层的特征进行预测
  3. 类SSD(one-shot detector)的使用多尺度特征融合的方式,使用不同层抽取不同尺度特征做预测。
  4. 构建高级语义的特征金字塔FPN,输入一张图片,采用全卷积在多层次输出不同比例的特征图。因为高层特征图的分辨率较低,则融合低层高分辨率信息与高层特征图,在每个融合后的特征层上进行单独预测。

d)FPN的结构样式  (应当明确一点,低层高分辨率的特征对检测小目标很重要

【目标检测】Scale-Aware Trident Networks for Object Detection 阅读笔记

PS:横向连接则是将上采样的结果和自底向上生成的相同大小的feature map进行融合(merge)。在融合之后还会再采用3*3的卷积核对每个融合结果进行卷积,目的是消除上采样的混叠效应。

 

这种自上而下的路径和横向连接的方法在卷积神经网络上是很通用的,在Faster-RCNN中加入FPN。例图:Faster R-CNN + Resnet-101

【目标检测】Scale-Aware Trident Networks for Object Detection 阅读笔记

Faster R-CNN利用Conv1~Conv4-x的91层为共享卷积层,然后从Conv4-x的输出开始分叉,一路经过RPN网络进行区域选择,另一路直接连一个ROI Pooling层,把RPN的结果输入ROI Pooling层,映射成7*7的特征。然后经过Conv5-x的计算,这里Conv5-x起到原来全连接层(fc)的作用,最后经过分类器和边框回归得到最终的结果。

 

Differ from prior work

作者认为检测器的性能无非与网络骨架的三个属性有关,网络深度,下采样比例,感受野。作者发现大的感受野对大目标检测效果很好,小目标检测则对应小的感受野。出发点就变成了将这种不同大小的感受野结合起来,同时使用大小不一的目标检测?(解决多尺度问题,感觉和RFBnet方法类似。。。)

TridentNet的特点是:

在原始的backbone上做了三点变化:第一点是构造了不同receptive field的parallel multi-branch,第二点是对于trident block中每一个branch的weight是share的。第三点是对于每个branch,训练和测试都只负责一定尺度范围内的样本,也就是所谓的scale-aware

【目标检测】Scale-Aware Trident Networks for Object Detection 阅读笔记

 

 

参考:https://www.cnblogs.com/fangpengchengbupter/p/7681683.html

https://zhuanlan.zhihu.com/p/54334986


推荐阅读
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • Thisworkcameoutofthediscussioninhttps://github.com/typesafehub/config/issues/272 ... [详细]
  • 详解 Python 的二元算术运算,为什么说减法只是语法糖?[Python常见问题]
    原题|UnravellingbinaryarithmeticoperationsinPython作者|BrettCannon译者|豌豆花下猫(“Python猫 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 本文介绍了九度OnlineJudge中的1002题目“Grading”的解决方法。该题目要求设计一个公平的评分过程,将每个考题分配给3个独立的专家,如果他们的评分不一致,则需要请一位裁判做出最终决定。文章详细描述了评分规则,并给出了解决该问题的程序。 ... [详细]
  • 本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法,并给出了问题的解析和解决方法。详细介绍了问题的背景和规则,并给出了相应的算法解析和实现步骤。通过本文的解析,读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]
  • 本文详细介绍了git常用命令及其操作方法,包括查看、添加、提交、删除、找回等操作,以及如何重置修改文件、抛弃工作区修改、将工作文件提交到本地暂存区、从版本库中删除文件等。同时还介绍了如何从暂存区恢复到工作文件、恢复最近一次提交过的状态,以及如何合并多个操作等。 ... [详细]
  • Whatsthedifferencebetweento_aandto_ary?to_a和to_ary有什么区别? ... [详细]
  • NotSupportedException无法将类型“System.DateTime”强制转换为类型“System.Object”
    本文介绍了在使用LINQ to Entities时出现的NotSupportedException异常,该异常是由于无法将类型“System.DateTime”强制转换为类型“System.Object”所导致的。同时还介绍了相关的错误信息和解决方法。 ... [详细]
  • 本文讨论了微软的STL容器类是否线程安全。根据MSDN的回答,STL容器类包括vector、deque、list、queue、stack、priority_queue、valarray、map、hash_map、multimap、hash_multimap、set、hash_set、multiset、hash_multiset、basic_string和bitset。对于单个对象来说,多个线程同时读取是安全的。但如果一个线程正在写入一个对象,那么所有的读写操作都需要进行同步。 ... [详细]
  • 本文介绍了如何使用MATLAB调用摄像头进行人脸检测和识别。首先需要安装扩展工具,并下载安装OS Generic Video Interface。然后使用MATLAB的机器视觉工具箱中的VJ算法进行人脸检测,可以直接调用CascadeObjectDetector函数进行检测。同时还介绍了如何调用摄像头进行人脸识别,并对每一帧图像进行识别。最后,给出了一些相关的参考资料和实例。 ... [详细]
  • Introduction(简介)Forbeingapowerfulobject-orientedprogramminglanguage,Cisuseda ... [详细]
  • 基于词向量计算文本相似度1.测试数据:链接:https:pan.baidu.coms1fXJjcujAmAwTfsuTg2CbWA提取码:f4vx2.实验代码:imp ... [详细]
author-avatar
mobiledu2502882333
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有