cornernetdetectingobjectsaspairedkeypoints论文阅读

作者：小赖小燕_380 | 来源：互联网 | 2023-10-13 11:51

论文地址：https:arxiv.orgpdf1808.01244.pdf代码地址：https:github.comumich-vlCornerNet

论文地址&＃xff1a;https://arxiv.org/pdf/1808.01244.pdf

代码地址&＃xff1a;https://github.com/umich-vl/CornerNet

ECCV2018, ECCV的全称是European conference on computer vision(欧洲计算机视觉国际会议&＃xff09;&＃xff0c;两年一次&＃xff0c;是计算机视觉三大会议&＃xff08;ICCV&＃xff0c;CVPR&＃xff09;之一。每次会议在全球范围录用论文300篇左右&＃xff0c;主要的录用论文都来自每过&＃xff0c;欧洲等顶尖实验室及研究所&＃xff0c;中国大陆的论文数量一般在10-20篇左右。ECCV2010的论文录取率为27%.

ECCV是一个欧洲会议&＃xff0c;欧洲人一般比较看中理论&＃xff0c;但是从最近一次会议来看&＃xff0c;似乎大家也开始注重应用了&＃xff0c;oral里面的demo非常之多&＃xff0c;演示效果很好&＃xff0c;让人赏心悦目&＃xff0c;叹为观止。不过欧洲的会有一个不好&＃xff0c;就是他们的人通常英语口音很重&＃xff0c;有些人甚至不太会说英文&＃xff0c;所以开会和交流的时候&＃xff0c;稍微有些费劲。

摘要&＃xff1a;

论文提出了一种新的目标检测方法&＃xff0c;使用单个卷积神经网络将目标边界框检测为一对关键点&＃xff08;即边界框的左上角和右下角&＃xff09;&＃xff0c;通过将目标检测为成对关键点&＃xff0c;消除了现有的one stage检测器设计中对一组anchors的需要&＃xff0c;除了上述新颖的构想&＃xff0c;文章还引入了corner pooling,这是一种新型的池化层&＃xff0c;可以帮助网络中更好地定位边界框的角点。CornerNet在MS COCO上实现了42.1%的AP&＃xff0c;优于所有现有的one stage检测器。

介绍&＃xff1a;

....

本文提出了cornerNet,这是一种新的one stage目标检测方法&＃xff0c;可以消除anchor boxes. 将一个目标物体检测为一对关键点--边界框的左上角和右下角。我们使用单个卷积网络来预测同一物体类别的所有实例的左上角的热土&＃xff0c;所有右下角的热土&＃xff0c;以及每个检测到的角点的嵌入向量&＃xff08;embedding vector for each detected corner&＃xff09;.嵌入用于对属于同一目标的一对角点进行分组---训练网络以预测他们的类似嵌入&＃xff08;The embeddings serve to group a pair of corners that belong to the same object--the network is trained to predict similar embeddings for them.)论文的方法受到Newell等人在多人姿态估计上下文中关联嵌入的启发。图1说明了论文方法的整体流程。

图1、我们将一个目标检测为一对组合在一起的边界框角点。卷积网络输出一个左上角热图和一个右下角热图&＃xff0c;并输出每个检测到的焦点的嵌入向量。训练网络以预测术语同一个目标的焦点的类似嵌入。

Cornernet的另一个新颖组件是corner pooling,这是一种新型的池化层&＃xff0c;可帮助卷积网络更好地定位边界框的角点&＃xff0c;边界框的一角通常在目标之外&＃xff0c;参考下图。

在这种情况下&＃xff0c;焦点不能根据当前的信息进行定位&＃xff0c;相反&＃xff0c;为了确定像素位置是否有左上角&＃xff0c;我们需要水平地向右看目标的最上面边界&＃xff0c;垂直的向底部看物体的最左边边界。这激发了我们的corner pooling layer: 它包含两个特征图&＃xff0c;在每个像素位置&＃xff0c;它最大池化从第一个特征映射到右侧的所有特征向量&＃xff0c;最大池化从第二个特征映射下面的所有特征向量&＃xff0c;然后将两个池化结果一起添加&＃xff0c;如下图&＃xff1a;

图3 corner pooling 对于每个通道&＃xff0c;我们采用两个方向&＃xff08;红线&＃xff09;的最大值&＃xff08;红点&＃xff09;&＃xff0c;每个方向都来自一个单独的特征图&＃xff0c;并将两个最大值加在一起&＃xff08;蓝点&＃xff09;

我们假设了两个原因&＃xff0c;为什么检测角点corners会比检测边界框中心或proposals更好些。首先&＃xff0c;box的中心可能更难以定位&＃xff0c;因为它取决于目标的所有4个边&＃xff0c;而定位corner只需要两个边&＃xff0c;因此更容易&＃xff0c;甚至更多的corner pooling,它编码一些明确的关于corner定义的先验信息。其次,corner提供了一种更有效的方式来密集地离散边界框的空间&＃xff0c;我们只需要用O(wh) 个corners来表示 O(w^2h^2)

3、2检测角点

我们预测两组热图&＃xff0c;一组用于左上角&＃xff0c;另一组用于右下角。每组热图具有C个通道&＃xff0c;其中C是分类的数量&＃xff0c;并且大小为H×W&＃xff0c;没有背景通道。每个通道都是一个二进制掩码&＃xff0c;用于表示该类的corner位置。

对于每个corner,有一个ground-truth正位置&＃xff0c;其他所有的位置都是负值。在训练期间&＃xff0c;我们没有同等地惩罚负位置&＃xff0c;而是减少对正位置半径内的负位置给予的惩罚。这是因为如果一对假corner检测器靠近他们各自的ground-truth位置&＃xff0c;它仍然可以产生一个与ground-truth充分重叠的边界框&＃xff0c;我们通过确保半径内的一对点生成的边界框与ground-truth的iou>t(实验中t设置为0.7)来确定物体的大小&＃xff0c;从而确定半径。给定半径&＃xff0c;惩罚的减少量由非标准化的2D高斯

$e^{-\frac{x^2&＃43;y^2}{2\sigma ^2}}$

其中心位于正位置&＃xff0c; $\sigma$ 是半径的1/3。

论文设计了一个局部损失&＃xff08;focal loss)的变体

未完待续

推荐阅读

filter
深入理解org.neo4j.helpers.collection.Iterators.single()方法及其应用

本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:51:55
case
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
get
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
get
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
case
GWT PopupPanel onKeyDownPreview 方法详解与实例

本文详细介绍了 GWT 中 PopupPanel 类的 onKeyDownPreview 方法，提供了多个代码示例及应用场景，帮助开发者更好地理解和使用该方法。 ... [详细]

蜡笔小新 2024-12-28 10:07:27
case
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
go
资源推荐 | TensorFlow官方中文教程助力英语非母语者学习

来源：机器之心。本文详细介绍了TensorFlow官方提供的中文版教程和指南，帮助开发者更好地理解和应用这一强大的开源机器学习平台。 ... [详细]

蜡笔小新 2024-12-28 09:00:51
input
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
object
Java 中的 BigDecimal pow()方法，示例

Java 中的 BigDecimal pow()方法，示例 ... [详细]

蜡笔小新 2024-12-27 20:54:03
get
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
const
深入解析Spring Cloud Ribbon负载均衡机制

本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式，帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]

蜡笔小新 2024-12-27 16:01:25
object
DNN Community 和 Professional 版本的主要差异

本文详细解析了 DotNetNuke (DNN) 的两种主要版本：Community 和 Professional。通过对比两者的功能和附加组件，帮助用户选择最适合其需求的版本。 ... [详细]

蜡笔小新 2024-12-27 13:14:08
instance
XNA 3.0 游戏编程：从 XML 文件加载数据

本文介绍如何在 XNA 3.0 游戏项目中从 XML 文件加载数据。我们将探讨如何将 XML 数据序列化为二进制文件，并通过内容管道加载到游戏中。此外，还会涉及自定义类型读取器和写入器的实现。 ... [详细]

蜡笔小新 2024-12-27 11:39:44
post
构建基于BERT的中文NL2SQL模型：一个简明的基准

本文探讨了将自然语言转换为SQL语句（NL2SQL）的任务，这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践，该比赛提供了金融和通用领域的表格数据，并标注了对应的自然语言与SQL语句对，旨在训练准确的NL2SQL模型。 ... [详细]

蜡笔小新 2024-12-27 17:36:19
post
Yii 实现阿里云短信发送

Yii 实现阿里云短信发送 ... [详细]

蜡笔小新 2024-12-27 15:22:37

小赖小燕_380

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章