热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

论文速读系列五:SASA、BtcDet、CGSSD、Multiviewframework、Ret3D

以下内容是对专栏:https:www.zhihu.comcolumnc_1370398704629858304的笔记记录文章目录1.SASA2.BtcDet3.CG-


以下内容是对专栏:https://www.zhihu.com/column/c_1370398704629858304的笔记记录


文章目录


  • 1. SASA
  • 2. BtcDet
  • 3. CG-SSD
  • 4. Multi-view framework
  • 5. Ret3D


1. SASA

paper:《SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object Detection》(2022AAAI)
结构图:
在这里插入图片描述

动机:
一般而言,SA模块先选择keypoints,再根据每个keypoints的周围点编码context representations。然而,在选择keypoints时,现有的采样策略通常以距离作为标准(如D-FPS、F-FPS),来选择较远的点来尽可能覆盖整个场景,但是这样会导致keypoints包含过多的背景点,从而导致pedestrian等点云数较少的object漏检。
通过引入point-wise语义信息,避免SA模块选择较多的背景点,提出了S-FPS采样策略。

思路:
1)基于已有的backbone,得到输入点云坐标X特征F;
2)将特征F输入分割模块,得到每个点云的前景分割得分P;
3)利用点云坐标X和分割得分P,利用S-FPS采样K个keypoints。这里的是计算公式为:





d


i
^



=



p i γ







d i



\hat{d_i} = p_i^γ·d_i

di^=piγdi

4)对于每一个关键点,利用PointNet++提取高维特征,再将keypoints坐标和高维特征输入后续检测头,进行检测等任务。

具体的算法流程如下所示:
在这里插入图片描述

相比与D-FPS,这里的S-FPS其实本质是就是对距离进行分割置信度加权计算。将S-FPS移植在One-Stage上的思路大题与3D-SSD思路一致的,也是同时利用了两个采用方法。只不过是将F-FPS替换成了这里的S-FPS。对比3DSSD,将F-FPS换成S-FPS,在kitti数据集的moderate上获得2.3%的提升。
在这里插入图片描述



2. BtcDet

paper:《Behind the Curtain: Learning Occluded Shapes for 3D Object Detection》(2022AAAI)
结构图:
在这里插入图片描述

动机:
点云检测中存在遮挡问题,大致分为:1)外部遮挡;2)信号缺失;3)自我遮挡。遮挡问题会影响检测精度,为此作者希望通过对目标补全缺失形状信息来解决遮挡问题。

思路:预测RoI的形状占有率(shape occupancy OS ),将其整合到点云特征中再进行目标检测。
1)BtcDet 首先确定遮挡区域 R_{OC} 和信号缺失区域R_{SM} ,再通过shape occupancy 网络Ω 估计RoI的形状占有率 P(O_S) ;
2)BtcDet 再通过backbone提取点云特征,然后将上述估计的形状占有率 P(O_S) 与点云特征相连,送到RPN生成proposals;
3)利用局部几何特征 f_{geo} 与grid特征进行refinement。

BtcDet在kitti的精度上还不错,算是前列了。
在这里插入图片描述



3. CG-SSD

paper:《G-SSD: Corner Guided Single Stage 3D Object Detection from LiDAR Point Cloud》(2022ACM)
结构图:
在这里插入图片描述

动机:
对于3D目标检测任务,目标中心点实际不存在点云数据,因此通过中心点来预测必然存在损失。相反,corner points 可以提供目标边界和尺寸信息。因此作者提出在BEV视图上,基于corner point(包括可见点和不可见点)预测目标bbox。corner附近存在很多目标点云,则corner的预测会相对准确。

思路:
1)voxelization(将点云分到规则的3D体素中) —> 3D feature learning(3D稀疏卷积提取特征) —> 2D feature learning(将3D体素特征投影到BEV视图,再进一步提取BEV特征)—> CGAM(利用辅助网络,提取corner points特征,cat到BEV特征上) —> detection head(分类和回归)
2)作者对corner point进一步细分,包括:visible corner(VC)、partly visible corner(PVCL、PVCW)和invisible corner(IVC)。首先,建立一个局部坐标系,将点云划分到4个象限,计算每个象限内点云的数量;对应点数最多的象限的点云为visible corner;与visible corner相对应象限的点为invisible corner;其他象限的点云为 partly visible corner。
3)这这里的CGAM模块会进行Classificatio loss以及Offset loss的计算。最终,score map(来自CGAN的classification task)、regression map(来自CGAM的regression task)以及BEV特征相连,一起送到detection head预测目标bbox。
在这里插入图片描述

paper长达27页,对于各个部分的结构讲述得非常详细了。在ONCE/Waymo数据集上进行测试,优于CenterPoint、PV-RCNN、PointPillars等算法。但是没有和一些新的SOTA算法比较。



4. Multi-view framework

paper:《A VERSATILE MULTI-VIEW FRAMEWORK FOR LIDAR-BASED3D OBJECT DETECTION WITH GUIDANCE FROM PANOPTICSEGMENTATION》(2022CVPR)
结构图:
在这里插入图片描述

动机:
利用全景分割作为辅助任务来指导BEV检测网络学习。同时,不同视角(view)均存在缺点,这里设置多视图融合充分利用不同view信息的优势,来提升检测性能。体现联合训练带来的性能提升。

思路:
1)目标检测框架采用CenterPoint,利用CPSeg框架进行全景分割与目标检测减小联合训练。将panoptic segmentation encoder的RV feature augment到检测网络的backbone中。
2)Attention-based RV-BEV Feature Weighting Module:类似CABM的attention机制,再通过channel attention + space attention的方式,weighting不同feature的重要性,融合RV-BEV feature。
在这里插入图片描述

实验思路:
在某个算法baseline上测试,再与一些经典sota进行对比。随后再移植到一些其他的检点算法上查看效果进行消融实验。
在这里插入图片描述
在这里插入图片描述



5. Ret3D

paper:《Ret3D: Rethinking Object Relations for Efficient 3D Object Detection in Driving Scenes》(2022TPAMI)
结构图:
在这里插入图片描述

动机:
在2D目标检测中,有很多工作证明过目标间的关联性可以提升检测性能。同理,作者认为,在3D目标检测中,目标间的关联性也可以提升检测性能。然而,现有的lidar-based检测器却鲜有探索目标间的关联性,大多数检测器都是在特征层面隐式的研究目标关联性带来的影响。提出了作者研究2种关联性对3D目标检测的影响:intra-frame relations 和 inter-frame relations。

  • intra-frame:对于同一帧点云,利用不同目标间的空间距离(预测的目标位置信息)作为先验知识,建立不同目标间的是sparse graph network,以避免冗余的计算;
  • inter-frame:对于不同帧点云的同一目标,引入transformer,通过tracked sequences,建立相同目标、不同帧下特征间的关联性。

思路:
1)One-stage base detector:已有的一阶段3D检测器(SECOND和CenterPoint)。输入点云 P — 转化为voxel — 特征提取,得到map-view features B — 得到初步检测结果 D (包括目标中心位置、尺寸、朝向和速度,定义为basic features) + croped features O (依据目标位置从 B croped);
2)IntraRM:根据目标位置和base detector提取的特征,搭建sparse graph network,建立同一帧内、不同目标间的关联性,对特征进行refine;
3)InterRM:根据不同帧(之前的点云)得到的相同目标的特征,利用transformer建立不同帧之间、相同目标的关联性;

实验:
Ret3D选用SECOND和centerpoint作为baseline,在waymod数据集上进行训练和测试,取得了极大的性能提升(6+%)
在这里插入图片描述


参考资料:

1. 知乎专栏:3D检测与分割






推荐阅读
  • 本文深入探讨了 hCalendar 微格式在事件与时间、地点相关活动标记中的应用。作为微格式系列文章的第四篇,前文已分别介绍了 rel 属性用于定义链接关系、XFN 微格式增强链接的人际关系描述以及 hCard 微格式对个人和组织信息的描述。本次将重点解析 hCalendar 如何通过结构化数据标记,提高事件信息的可读性和互操作性。 ... [详细]
  • 在CentOS 6.5环境中,本文详细介绍了如何配置SSH无密钥登录,并成功执行PSSH命令。首先,确保系统已安装PSSH工具,可使用 `yum install pssh` 进行安装。若未配置免密钥登录,PSSH命令将无法正常执行,例如尝试运行 `pssh -H root@192.168.245.129 -i uptime` 时会失败。通过生成并分发SSH公钥,可以实现无密码登录,从而顺利执行PSSH命令。此外,本文还提供了详细的步骤和常见问题的解决方案,帮助用户顺利完成配置。 ... [详细]
  • C#编程指南:实现列表与WPF数据网格的高效绑定方法 ... [详细]
  • 在单个图表中实现饼图与条形图的精准对齐 ... [详细]
  • 在对WordPress Duplicator插件0.4.4版本的安全评估中,发现其存在跨站脚本(XSS)攻击漏洞。此漏洞可能被利用进行恶意操作,建议用户及时更新至最新版本以确保系统安全。测试方法仅限于安全研究和教学目的,使用时需自行承担风险。漏洞编号:HTB23162。 ... [详细]
  • 优化后的标题:深入探讨网关安全:将微服务升级为OAuth2资源服务器的最佳实践
    本文深入探讨了如何将微服务升级为OAuth2资源服务器,以订单服务为例,详细介绍了在POM文件中添加 `spring-cloud-starter-oauth2` 依赖,并配置Spring Security以实现对微服务的保护。通过这一过程,不仅增强了系统的安全性,还提高了资源访问的可控性和灵活性。文章还讨论了最佳实践,包括如何配置OAuth2客户端和资源服务器,以及如何处理常见的安全问题和错误。 ... [详细]
  • 在使用 Qt 进行 YUV420 图像渲染时,由于 Qt 本身不支持直接绘制 YUV 数据,因此需要借助 QOpenGLWidget 和 OpenGL 技术来实现。通过继承 QOpenGLWidget 类并重写其绘图方法,可以利用 GPU 的高效渲染能力,实现高质量的 YUV420 图像显示。此外,这种方法还能显著提高图像处理的性能和流畅性。 ... [详细]
  • 在Ubuntu上安装MySQL时解决缺少libaio.so.1错误及libaio在MySQL中的重要性分析
    在Ubuntu系统上安装MySQL时,遇到了缺少libaio.so.1的错误。本文详细介绍了如何解决这一问题,并深入探讨了libaio库在MySQL性能优化中的重要作用。对于初学者而言,理解这些依赖关系和配置步骤是成功安装和运行MySQL的关键。通过本文的指导,读者可以顺利解决相关问题,并更好地掌握MySQL在Linux环境下的部署与管理。 ... [详细]
  • Squaretest:自动生成功能测试代码的高效插件
    本文将介绍一款名为Squaretest的高效插件,该工具能够自动生成功能测试代码。使用这款插件的主要原因是公司近期加强了代码质量的管控,对各项目进行了严格的单元测试评估。Squaretest不仅提高了测试代码的生成效率,还显著提升了代码的质量和可靠性。 ... [详细]
  • IDEA 2019.2 中 SFTP 部署功能无法成功连接至服务器的问题分析与解决 ... [详细]
  • 本文介绍了UUID(通用唯一标识符)的概念及其在JavaScript中生成Java兼容UUID的代码实现与优化技巧。UUID是一个128位的唯一标识符,广泛应用于分布式系统中以确保唯一性。文章详细探讨了如何利用JavaScript生成符合Java标准的UUID,并提供了多种优化方法,以提高生成效率和兼容性。 ... [详细]
  • 英语面试技巧:提升个人技能与表现
    在英语面试中,个人技能是指除专业知识外,能够促进职业发展的各种能力。虽然你可能具备多种技能,但建议重点突出与目标岗位最相关的几项,以增强面试官对你专业能力和适应性的认可。 ... [详细]
  • 深入解析JWT的实现与应用
    本文深入探讨了JSON Web Token (JWT) 的实现机制及其应用场景。JWT 是一种基于 RFC 7519 标准的开放性认证协议,用于在各方之间安全地传输信息。文章详细分析了 JWT 的结构、生成和验证过程,并讨论了其在现代 Web 应用中的实际应用案例,为开发者提供了全面的理解和实践指导。 ... [详细]
  • 本项目在Java Maven框架下,利用POI库实现了Excel数据的高效导入与导出功能。通过优化数据处理流程,提升了数据操作的性能和稳定性。项目已发布至GitHub,当前最新版本为0.0.5。该项目不仅适用于小型应用,也可扩展用于大型企业级系统,提供了灵活的数据管理解决方案。GitHub地址:https://github.com/83945105/holygrail,Maven坐标:`com.github.83945105:holygrail:0.0.5`。 ... [详细]
  • 尽管存在唯一列,仍显示“当前选择不包含唯一列。网格编辑、复选框、编辑、复制和删除功能不可用”的消息。 ... [详细]
author-avatar
hareleemu_699
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有