当前位置: 开发笔记 > 编程语言 > 正文

PCL——RCNNFamily中层次点云处理

作者：强压谷攻 | 来源：互联网 | 2023-09-09 12:55

博客转载自：http:www.cnblogs.comironstarkp6046411.htmlRCNN是从图像中检测物体位置的方法，严格来讲不属于三维

博客转载自&＃xff1a;http://www.cnblogs.com/ironstark/p/6046411.html

RCNN是从图像中检测物体位置的方法&＃xff0c;严格来讲不属于三维计算机视觉。但是这种方法却又非常非常重要&＃xff0c;对三维物体的检测非常有启发&＃xff0c;所以在这里做个总结。

1、RCNN - the original idea

"Rich feature hierarchies for accurate object detection and semantic segmentation"这篇文章提出了用CNN网络来对物体进行检测的思路。

　　a. CNN网络中存在卷积层和池化层&＃xff0c;每次池化都会弱化物体的位置信息&＃xff0c;强化物体的特征信息&＃xff0c;所以CNN网络最终会告诉我们是什么&＃xff0c;而不是在哪儿

　　b. 要使用CNN网络来检测&＃xff0c;直觉上我们可以训练一个识别某物体的网络&＃xff0c;来对小方块进行分类。但是这需要大量的训练集&＃xff0c;可能对于待检测物体&＃xff0c;我们没有收集大量训练集的机会

　　c. CNN网络的图像输入层具有固定的维度&＃xff0c;任意大小的小方块是无法直接输入到CNN网络里的

　　a. 文章提出了可以在已经训练好的网络上利用小规模的训练集进行优化&＃xff0c;也能达到很好的效果。

　　b.通过 selective search来确定可能含有物体的小方块

　　c.将消方块进行拉伸&＃xff08;warp&＃xff09;&＃xff0c;送入CNN进行分类&＃xff0c;最终实现检测

细节&＃xff1a;

　　1、使用了ILSVRC 2012对网络进行预训练&＃xff0c;步长0.01

　　2、精训练使用的步长是0.001

　　3、mini-batch size &＃61; 128, 其中背景96&＃xff0c;带东西的32。有意的bias&＃xff0c;让网络更大概率判为背景

　　4、loss function 中&＃xff0c;IoU超过50%判为1&＃xff0c;否则为0

　　5、使用svm对物体类别进行判断

　　6、对box进行线性回归&＃xff0c;获得更高的精度(后面还会提到)

2、SPPNet - 结合金字塔

Spatial pyramid pooling in deep convolutional networks for visual recognition -- 在第一步使用rcnn中&＃xff0c;检测需要将图片拉伸成特定的大小&＃xff0c;便于输入网络。这显然很不合理&＃xff0c;很多东西拉伸以后就完全变形了&＃xff0c;这会降低检测的精度。所以需要一种不拉伸方块的方法&＃xff0c;来对物体进行检测。

　　a.拉伸图像会带来识别精度的下降&＃xff0c;在r-cnn中尤其明显

　　a.金字塔池化&＃xff1a;将任意维度的图片池化成同一维度。例如&＃xff0c;图片为256*256&＃xff0c;金字塔接受的就是maxpool2dlayer(16,&＃39;stride&＃39;,16),如果图片为128*128&＃xff0c;金字塔接受的就是maxpool2dlayer(8,&＃39;stride&＃39;,8)

细节&＃xff1a;只用了两种bin size 来构建训练集&＃xff0c;180 * 180&＃xff0c; 224 * 224. 因为只有两种情况&＃xff0c;所以可以很方便的构建bp函数

3、FastCNN - 要啥金字塔&＃xff0c;一层就够啦

　　a.对于每个 box/proposal 都需要进行一次feed forward.

　　b.训练时需要对分类函数和回归函数分开训练

　　a.对图像进行一次整体的feed forward&＃xff0c;得到总的卷积结果&＃xff1b;对总结果中的box&＃xff0c;每个box一次&＃xff0c;分别进行ROI pooling (其实就是金字塔的第一层)

　　b. ROI pooling 后会得到固定维度的向量&＃xff0c;送入多次全连接层&＃xff0c;直接映射成类别和box的回归

细节&＃xff1a;1、训练时&＃xff0c;所有的权重都得到迭代

4、Faster R-CNN — 这才是颠覆

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

　　a. 对每张图都要进行一次 selective search 以获得proposal太耗时了

　　a.设计一个神经网络 Region Proposal Net 自动来提出proposal 吧&＃xff01;

RPN 本质上可以看作一个非常独立的部分&＃xff0c;虽然它号称使用了整幅图像的feature&＃xff0c;但功能上RPN是独立的。RPN的任务是输入图像&＃xff0c;输出一系列Proposal&＃xff08;四点坐标&＃43;是否有物体&＃xff09;

1、使用卷积网络的最后一个卷积层卷积完的结果 Last_Image * final_convolution2dlayer(n,d). 作为RPN的真正输入&＃xff08;前面都是公用的&＃xff0c;后面才是RPN&＃xff09;

2、使用一个3*3的小卷积掩模将1中的结果抽象成d 维向量。

3、将该向量送入2个全连接层——分类全连接&＃xff08;2K输出&＃xff09;和坐标全连接&＃xff08;4K输出&＃xff09;————k个proposal &＃xff08;3 scale,2 aspect ratio&＃xff09;

4、在2中&＃xff0c;掩模的位置决定了全连接输出参数的"原点"

5、总结

在神经网络中&＃xff0c;全连接是最强的非线性映射方式&＃xff0c;也是花费最重的。在结果层少量的使用全连接以换取强大的映射方程是很有意义的。

说了那么多&＃xff0c;和三维视觉有毛关系&＃xff1f;其实关系在这里&＃xff0c;在二维图像中检测物体位置和在三维图像中检测物体位姿是对偶的。不信&＃xff1f;见

转:https://www.cnblogs.com/flyinggod/p/8477030.html

推荐阅读

object
WPF项目学习.一

WPF项目搭建版权声明：本文为博主初学经验，未经博主允许不得转载。一、前言记录在学习与制作WPF过程中遇到的解决方案。使用MVVM的优点是数据和视图分离，双向绑定，低耦合，可重用行 ... [详细]

蜡笔小新 2024-11-15 11:38:43
object
使用HTML和JavaScript实现视频截图功能

本文介绍了如何利用HTML和JavaScript实现从远程MP4、本地摄像头及本地上传的MP4文件中截取视频帧，并展示了具体的实现步骤和示例代码。 ... [详细]

蜡笔小新 2024-11-15 00:19:42
object
包含phppdoerrorcode的词条

包含phppdoerrorcode的词条 ... [详细]

蜡笔小新 2024-11-14 12:06:14
python
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
object
VB.net 进程通信中FindWindow、FindWindowEX、SendMessage函数的理解

目录一、代码背景二、主要工具三、函数解析1、FindWindow：2、FindWindowEx：3、SendMessage： ... [详细]

蜡笔小新 2024-11-13 14:28:28
object
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
object
PHP 对象生命周期与内存管理

本文详细介绍了 PHP 中对象的生命周期、内存管理和魔术方法的使用，包括对象的自动销毁、析构函数的作用以及各种魔术方法的具体应用场景。 ... [详细]

蜡笔小新 2024-11-12 13:35:26
object
在 QQmlPropertyMap 的派生类中无法调用槽函数或 Q_INVOKABLE 方法？

在尝试对 QQmlPropertyMap 类进行测试驱动开发时，发现其派生类中无法正常调用槽函数或 Q_INVOKABLE 方法。这可能是由于 QQmlPropertyMap 的内部实现机制导致的，需要进一步研究以找到解决方案。 ... [详细]

蜡笔小新 2024-11-11 15:34:22
python
使用 Jupyter Notebook 实现 Markdown 编写与代码运行

Jupyter Notebook 是一个开源的基于网页的应用程序，允许用户在同一文档中编写 Markdown 文本和运行多种编程语言的代码，并实时查看运行结果。 ... [详细]

蜡笔小新 2024-11-15 14:50:50
io
Android Studio SQLite 数据库增删改查简单（代码参考）

一个建表一个执行crud操作建表代码importandroid.content.Context;importandroid.database.sqlite.SQLiteDat ... [详细]

蜡笔小新 2024-11-14 11:01:49
object
JUC（三）：深入解析AQS

本文详细介绍了Java并发工具包中的核心类AQS（AbstractQueuedSynchronizer），包括其基本概念、数据结构、源码分析及核心方法的实现。 ... [详细]

蜡笔小新 2024-11-13 15:40:34
object
Java DAO模式详解与代码示例

DAO（Data Access Object）模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法，它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ... [详细]

蜡笔小新 2024-11-13 12:25:33
io
微信公众号推送模板40036问题

返回码错误码描述说明40001invalidcredential不合法的调用凭证40002invalidgrant_type不合法的grant_type40003invalidop ... [详细]

蜡笔小新 2024-11-12 16:31:32
object
com.hazelcast.config.MapConfig.isStatisticsEnabled()方法的使用及代码示例

com.hazelcast.config.MapConfig.isStatisticsEnabled()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-12 14:33:17
object
深入解析 Lifecycle 的实现原理

本文将详细介绍 Android Jetpack 中 Lifecycle 组件的实现原理，帮助开发者更好地理解和使用 Lifecycle，避免常见的内存泄漏问题。 ... [详细]

蜡笔小新 2024-11-12 14:05:19

强压谷攻

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章