论文速读系列五：SASA、BtcDet、CGSSD、Multiviewframework、Ret3D

作者：hareleemu_699 | 来源：互联网 | 2023-09-08 08:23

以下内容是对专栏：https:www.zhihu.comcolumnc_1370398704629858304的笔记记录文章目录1.SASA2.BtcDet3.CG-

以下内容是对专栏&＃xff1a;https://www.zhihu.com/column/c_1370398704629858304的笔记记录

文章目录

1. SASA
2. BtcDet
3. CG-SSD
4. Multi-view framework
5. Ret3D

1. SASA

paper&＃xff1a;《SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object Detection》&＃xff08;2022AAAI&＃xff09;
结构图&＃xff1a;
在这里插入图片描述

动机&＃xff1a;
一般而言&＃xff0c;SA模块先选择keypoints&＃xff0c;再根据每个keypoints的周围点编码context representations。然而&＃xff0c;在选择keypoints时&＃xff0c;现有的采样策略通常以距离作为标准&＃xff08;如D-FPS、F-FPS&＃xff09;&＃xff0c;来选择较远的点来尽可能覆盖整个场景&＃xff0c;但是这样会导致keypoints包含过多的背景点&＃xff0c;从而导致pedestrian等点云数较少的object漏检。
通过引入point-wise语义信息&＃xff0c;避免SA模块选择较多的背景点&＃xff0c;提出了S-FPS采样策略。

思路&＃xff1a;
1&＃xff09;基于已有的backbone&＃xff0c;得到输入点云坐标X和特征F&＃xff1b;
2&＃xff09;将特征F输入分割模块&＃xff0c;得到每个点云的前景分割得分P&＃xff1b;
3&＃xff09;利用点云坐标X和分割得分P&＃xff0c;利用S-FPS采样K个keypoints。这里的是计算公式为&＃xff1a; $\hat{d_i} &＃61; p_i^γ·d_i$

4&＃xff09;对于每一个关键点&＃xff0c;利用PointNet&＃43;&＃43;提取高维特征&＃xff0c;再将keypoints坐标和高维特征输入后续检测头&＃xff0c;进行检测等任务。

具体的算法流程如下所示&＃xff1a;
在这里插入图片描述

相比与D-FPS&＃xff0c;这里的S-FPS其实本质是就是对距离进行分割置信度加权计算。将S-FPS移植在One-Stage上的思路大题与3D-SSD思路一致的&＃xff0c;也是同时利用了两个采用方法。只不过是将F-FPS替换成了这里的S-FPS。对比3DSSD&＃xff0c;将F-FPS换成S-FPS&＃xff0c;在kitti数据集的moderate上获得2.3%的提升。
在这里插入图片描述

2. BtcDet

paper&＃xff1a;《Behind the Curtain: Learning Occluded Shapes for 3D Object Detection》&＃xff08;2022AAAI&＃xff09;
结构图&＃xff1a;
在这里插入图片描述

动机&＃xff1a;
点云检测中存在遮挡问题&＃xff0c;大致分为&＃xff1a;1&＃xff09;外部遮挡&＃xff1b;2&＃xff09;信号缺失&＃xff1b;3&＃xff09;自我遮挡。遮挡问题会影响检测精度&＃xff0c;为此作者希望通过对目标补全缺失形状信息来解决遮挡问题。

思路&＃xff1a;预测RoI的形状占有率&＃xff08;shape occupancy OS &＃xff09;&＃xff0c;将其整合到点云特征中再进行目标检测。
1&＃xff09;BtcDet 首先确定遮挡区域 R_{OC} 和信号缺失区域R_{SM} &＃xff0c;再通过shape occupancy 网络Ω 估计RoI的形状占有率 P(O_S) &＃xff1b;
2&＃xff09;BtcDet 再通过backbone提取点云特征&＃xff0c;然后将上述估计的形状占有率 P(O_S) 与点云特征相连&＃xff0c;送到RPN生成proposals&＃xff1b;
3&＃xff09;利用局部几何特征 f_{geo} 与grid特征进行refinement。

BtcDet在kitti的精度上还不错&＃xff0c;算是前列了。
在这里插入图片描述

3. CG-SSD

paper&＃xff1a;《G-SSD: Corner Guided Single Stage 3D Object Detection from LiDAR Point Cloud》&＃xff08;2022ACM&＃xff09;
结构图&＃xff1a;
在这里插入图片描述

动机&＃xff1a;
对于3D目标检测任务&＃xff0c;目标中心点实际不存在点云数据&＃xff0c;因此通过中心点来预测必然存在损失。相反&＃xff0c;corner points 可以提供目标边界和尺寸信息。因此作者提出在BEV视图上&＃xff0c;基于corner point&＃xff08;包括可见点和不可见点&＃xff09;预测目标bbox。corner附近存在很多目标点云&＃xff0c;则corner的预测会相对准确。

思路&＃xff1a;
1&＃xff09;voxelization&＃xff08;将点云分到规则的3D体素中&＃xff09; —> 3D feature learning&＃xff08;3D稀疏卷积提取特征&＃xff09; —> 2D feature learning&＃xff08;将3D体素特征投影到BEV视图&＃xff0c;再进一步提取BEV特征&＃xff09;—> CGAM&＃xff08;利用辅助网络&＃xff0c;提取corner points特征&＃xff0c;cat到BEV特征上&＃xff09; —> detection head&＃xff08;分类和回归&＃xff09;
2&＃xff09;作者对corner point进一步细分&＃xff0c;包括&＃xff1a;visible corner&＃xff08;VC&＃xff09;、partly visible corner&＃xff08;PVCL、PVCW&＃xff09;和invisible corner&＃xff08;IVC&＃xff09;。首先&＃xff0c;建立一个局部坐标系&＃xff0c;将点云划分到4个象限&＃xff0c;计算每个象限内点云的数量&＃xff1b;对应点数最多的象限的点云为visible corner&＃xff1b;与visible corner相对应象限的点为invisible corner&＃xff1b;其他象限的点云为 partly visible corner。
3&＃xff09;这这里的CGAM模块会进行Classificatio loss以及Offset loss的计算。最终&＃xff0c;score map&＃xff08;来自CGAN的classification task&＃xff09;、regression map&＃xff08;来自CGAM的regression task&＃xff09;以及BEV特征相连&＃xff0c;一起送到detection head预测目标bbox。
在这里插入图片描述

paper长达27页&＃xff0c;对于各个部分的结构讲述得非常详细了。在ONCE/Waymo数据集上进行测试&＃xff0c;优于CenterPoint、PV-RCNN、PointPillars等算法。但是没有和一些新的SOTA算法比较。

4. Multi-view framework

paper&＃xff1a;《A VERSATILE MULTI-VIEW FRAMEWORK FOR LIDAR-BASED3D OBJECT DETECTION WITH GUIDANCE FROM PANOPTICSEGMENTATION》&＃xff08;2022CVPR&＃xff09;
结构图&＃xff1a;
在这里插入图片描述

动机&＃xff1a;
利用全景分割作为辅助任务来指导BEV检测网络学习。同时&＃xff0c;不同视角&＃xff08;view&＃xff09;均存在缺点&＃xff0c;这里设置多视图融合充分利用不同view信息的优势&＃xff0c;来提升检测性能。体现联合训练带来的性能提升。

思路&＃xff1a;
1&＃xff09;目标检测框架采用CenterPoint&＃xff0c;利用CPSeg框架进行全景分割与目标检测减小联合训练。将panoptic segmentation encoder的RV feature augment到检测网络的backbone中。
2&＃xff09;Attention-based RV-BEV Feature Weighting Module&＃xff1a;类似CABM的attention机制&＃xff0c;再通过channel attention &＃43; space attention的方式&＃xff0c;weighting不同feature的重要性&＃xff0c;融合RV-BEV feature。
在这里插入图片描述

实验思路&＃xff1a;
在某个算法baseline上测试&＃xff0c;再与一些经典sota进行对比。随后再移植到一些其他的检点算法上查看效果进行消融实验。
在这里插入图片描述

5. Ret3D

paper&＃xff1a;《Ret3D: Rethinking Object Relations for Efficient 3D Object Detection in Driving Scenes》&＃xff08;2022TPAMI&＃xff09;
结构图&＃xff1a;
在这里插入图片描述

动机&＃xff1a;
在2D目标检测中&＃xff0c;有很多工作证明过目标间的关联性可以提升检测性能。同理&＃xff0c;作者认为&＃xff0c;在3D目标检测中&＃xff0c;目标间的关联性也可以提升检测性能。然而&＃xff0c;现有的lidar-based检测器却鲜有探索目标间的关联性&＃xff0c;大多数检测器都是在特征层面隐式的研究目标关联性带来的影响。提出了作者研究2种关联性对3D目标检测的影响&＃xff1a;intra-frame relations 和 inter-frame relations。

intra-frame&＃xff1a;对于同一帧点云&＃xff0c;利用不同目标间的空间距离&＃xff08;预测的目标位置信息&＃xff09;作为先验知识&＃xff0c;建立不同目标间的是sparse graph network&＃xff0c;以避免冗余的计算&＃xff1b;
inter-frame&＃xff1a;对于不同帧点云的同一目标&＃xff0c;引入transformer&＃xff0c;通过tracked sequences&＃xff0c;建立相同目标、不同帧下特征间的关联性。

思路&＃xff1a;
1&＃xff09;One-stage base detector&＃xff1a;已有的一阶段3D检测器&＃xff08;SECOND和CenterPoint&＃xff09;。输入点云 P — 转化为voxel — 特征提取&＃xff0c;得到map-view features B — 得到初步检测结果 D &＃xff08;包括目标中心位置、尺寸、朝向和速度&＃xff0c;定义为basic features&＃xff09; &＃43; croped features O &＃xff08;依据目标位置从 B croped&＃xff09;&＃xff1b;
2&＃xff09;IntraRM&＃xff1a;根据目标位置和base detector提取的特征&＃xff0c;搭建sparse graph network&＃xff0c;建立同一帧内、不同目标间的关联性&＃xff0c;对特征进行refine&＃xff1b;
3&＃xff09;InterRM&＃xff1a;根据不同帧&＃xff08;之前的点云&＃xff09;得到的相同目标的特征&＃xff0c;利用transformer建立不同帧之间、相同目标的关联性&＃xff1b;

实验&＃xff1a;
Ret3D选用SECOND和centerpoint作为baseline&＃xff0c;在waymod数据集上进行训练和测试&＃xff0c;取得了极大的性能提升&＃xff08;6&＃43;%&＃xff09;
在这里插入图片描述

参考资料&＃xff1a;

1. 知乎专栏&＃xff1a;3D检测与分割

推荐阅读

tree
优化后的标题：hCalendar微格式：深入解析事件与时间、地点相关的活动标记方法

本文深入探讨了 hCalendar 微格式在事件与时间、地点相关活动标记中的应用。作为微格式系列文章的第四篇，前文已分别介绍了 rel 属性用于定义链接关系、XFN 微格式增强链接的人际关系描述以及 hCard 微格式对个人和组织信息的描述。本次将重点解析 hCalendar 如何通过结构化数据标记，提高事件信息的可读性和互操作性。 ... [详细]

蜡笔小新 2024-11-04 17:57:52
uml
CentOS 6.5环境下配置SSH无密钥登录并执行PSSH命令的详细教程

在CentOS 6.5环境中，本文详细介绍了如何配置SSH无密钥登录，并成功执行PSSH命令。首先，确保系统已安装PSSH工具，可使用 `yum install pssh` 进行安装。若未配置免密钥登录，PSSH命令将无法正常执行，例如尝试运行 `pssh -H root@192.168.245.129 -i uptime` 时会失败。通过生成并分发SSH公钥，可以实现无密码登录，从而顺利执行PSSH命令。此外，本文还提供了详细的步骤和常见问题的解决方案，帮助用户顺利完成配置。 ... [详细]

蜡笔小新 2024-11-03 08:42:54
object
C#编程指南：实现列表与WPF数据网格的高效绑定方法

C#编程指南：实现列表与WPF数据网格的高效绑定方法 ... [详细]

蜡笔小新 2024-10-31 10:46:47
text
在单个图表中实现饼图与条形图的精准对齐

在单个图表中实现饼图与条形图的精准对齐 ... [详细]

蜡笔小新 2024-10-29 13:42:17
java
WordPress Duplicator 0.4.4 版本存在跨站脚本攻击漏洞分析

在对WordPress Duplicator插件0.4.4版本的安全评估中，发现其存在跨站脚本（XSS）攻击漏洞。此漏洞可能被利用进行恶意操作，建议用户及时更新至最新版本以确保系统安全。测试方法仅限于安全研究和教学目的，使用时需自行承担风险。漏洞编号：HTB23162。 ... [详细]

蜡笔小新 2024-11-10 13:16:43
java
优化后的标题：深入探讨网关安全：将微服务升级为OAuth2资源服务器的最佳实践

本文深入探讨了如何将微服务升级为OAuth2资源服务器，以订单服务为例，详细介绍了在POM文件中添加 `spring-cloud-starter-oauth2` 依赖，并配置Spring Security以实现对微服务的保护。通过这一过程，不仅增强了系统的安全性，还提高了资源访问的可控性和灵活性。文章还讨论了最佳实践，包括如何配置OAuth2客户端和资源服务器，以及如何处理常见的安全问题和错误。 ... [详细]

蜡笔小新 2024-11-09 16:13:27
object
使用 QT 实现 YUV420 图像渲染技术

在使用 Qt 进行 YUV420 图像渲染时，由于 Qt 本身不支持直接绘制 YUV 数据，因此需要借助 QOpenGLWidget 和 OpenGL 技术来实现。通过继承 QOpenGLWidget 类并重写其绘图方法，可以利用 GPU 的高效渲染能力，实现高质量的 YUV420 图像显示。此外，这种方法还能显著提高图像处理的性能和流畅性。 ... [详细]

蜡笔小新 2024-11-09 15:02:41
tree
在Ubuntu上安装MySQL时解决缺少libaio.so.1错误及libaio在MySQL中的重要性分析

在Ubuntu系统上安装MySQL时，遇到了缺少libaio.so.1的错误。本文详细介绍了如何解决这一问题，并深入探讨了libaio库在MySQL性能优化中的重要作用。对于初学者而言，理解这些依赖关系和配置步骤是成功安装和运行MySQL的关键。通过本文的指导，读者可以顺利解决相关问题，并更好地掌握MySQL在Linux环境下的部署与管理。 ... [详细]

蜡笔小新 2024-11-08 11:19:54
settings
Squaretest：自动生成功能测试代码的高效插件

本文将介绍一款名为Squaretest的高效插件，该工具能够自动生成功能测试代码。使用这款插件的主要原因是公司近期加强了代码质量的管控，对各项目进行了严格的单元测试评估。Squaretest不仅提高了测试代码的生成效率，还显著提升了代码的质量和可靠性。 ... [详细]

蜡笔小新 2024-11-07 15:34:27
settings
IDEA 2019.2 中 SFTP 部署功能无法成功连接至服务器的问题分析与解决

IDEA 2019.2 中 SFTP 部署功能无法成功连接至服务器的问题分析与解决 ... [详细]

蜡笔小新 2024-11-06 13:56:06
java
使用JavaScript生成Java兼容的UUID代码实现与优化技巧

本文介绍了UUID（通用唯一标识符）的概念及其在JavaScript中生成Java兼容UUID的代码实现与优化技巧。UUID是一个128位的唯一标识符，广泛应用于分布式系统中以确保唯一性。文章详细探讨了如何利用JavaScript生成符合Java标准的UUID，并提供了多种优化方法，以提高生成效率和兼容性。 ... [详细]

蜡笔小新 2024-11-05 18:19:54
command
英语面试技巧：提升个人技能与表现

在英语面试中，个人技能是指除专业知识外，能够促进职业发展的各种能力。虽然你可能具备多种技能，但建议重点突出与目标岗位最相关的几项，以增强面试官对你专业能力和适应性的认可。 ... [详细]

蜡笔小新 2024-11-04 11:22:06
java
深入解析JWT的实现与应用

本文深入探讨了JSON Web Token (JWT) 的实现机制及其应用场景。JWT 是一种基于 RFC 7519 标准的开放性认证协议，用于在各方之间安全地传输信息。文章详细分析了 JWT 的结构、生成和验证过程，并讨论了其在现代 Web 应用中的实际应用案例，为开发者提供了全面的理解和实践指导。 ... [详细]

蜡笔小新 2024-10-31 20:06:46
java
基于POI的Java Maven项目中实现Excel数据的高效导入与导出功能

本项目在Java Maven框架下，利用POI库实现了Excel数据的高效导入与导出功能。通过优化数据处理流程，提升了数据操作的性能和稳定性。项目已发布至GitHub，当前最新版本为0.0.5。该项目不仅适用于小型应用，也可扩展用于大型企业级系统，提供了灵活的数据管理解决方案。GitHub地址：https://github.com/83945105/holygrail，Maven坐标：`com.github.83945105:holygrail:0.0.5`。 ... [详细]

蜡笔小新 2024-10-31 18:52:27
default
尽管存在唯一列，仍显示“当前选择不包含唯一列。网格编辑、复选框、编辑、复制和删除功能不可用”的消息。

尽管存在唯一列，仍显示“当前选择不包含唯一列。网格编辑、复选框、编辑、复制和删除功能不可用”的消息。 ... [详细]

蜡笔小新 2024-10-30 18:52:18

hareleemu_699

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章