飞桨火力全开，重磅上线3D模型：PointNet++、PointRCNN！

作者：叶晴琼 | 来源：互联网 | 2023-08-22 20:25

飞,桨,火力,全开,重磅,上,线,3d,模型,pointnet

11年前的「阿凡达」让少年的我们第一次戴上3D眼镜，声势浩大的瀑布奔流而下，星罗棋布飘浮在空中的群山，无一不体现着对生命的敬意，妥妥的坐稳了2010年北美、海外、中国和全球票房No.1的宝座，「3D」正式进入了大众的视线。

图片来自网络

11年过去了，出走半生，我们依旧少年，「阿凡达2」依旧没有如约上映，但3D应用却在此期间得到了蓬勃的发展。这一方面得益于3D传感器技术的飞速发展，用户可以更加便捷地获取到三维图像数据；另一方面随着机器人、无人驾驶、AR&VR等业务的日趋成熟，需要快速处理和理解海量的3D数据，以便精确感知周边物体的空间信息，3D数据的深度学习需求应运而生。随着2020年中国新基建政策的发布，相信未来3D视觉技术将会有更广阔的应用空间。

下载安装命令 ## CPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle ## GPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu

3D深度学习需要什么格式的数据输入？

2D图像可以天然的表示成二维矩阵，但3D数据却非常复杂，它有很多种表达形式，如：点云、体积像素、多边形网格和多视图。在3D深度学习领域中，点云数据应用最为广泛。这是因为点云数据非常接近原始的传感器数据，采用这种形式，可以更好的挖掘原始数据中的信息，使用较少的数据即可表征较多的细节的特性。此外点云的表达形式非常简单，模型训练时，对GPU性能没有太高的要求。

但是点云是不规则的数据，在空间中可以任意分布。传统情况下，可以先将点云数据转化成体积像素表示方式，再复用2D图像的CNN模型，但是代价会非常高。原因是体积像素在空间中的稀疏性使得3D CNN训练对显存要求极高，模型难以收敛。

那么，是否有方法可以直接在点云上数据上实现特征学习呢？

飞桨开源框架1.7版本发布了用于3D点云分类、分割和检测的PointNet++和PointRCNN模型。支持ShapeNet，ModelNet，KITTI等多种点云数据集，在ModelNet40数据集上，PointNet++分类精度可达90%，在 KITTI（Car）的Easy数据子集上，PointRCNN检测精度可达86.66%，持平世界领先水平。开发者在飞桨框架基础上可快速完成任务，实现工业应用。3D模型体验请戳如下链接：

https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/3d_vision

PointNet++原理和实验表现

PointNet++核心是通过多级点集特征学习提取点云数据的特征，然后将提取的特征分别输入到分类和分割网络，进行3D数据的图像分类和语义分割，PointNet++网络结构下图所示。

多级点集特征学习（Hierarchical point set feature learning）

集合抽象层是多级点集特征学习的基本模块，由如下三个关键部分组成：

采样层：使用最远点采样（FPS）的方法，从输入点中选择一组点，定义局部区域的中心。
分组层：根据中心点进行分组，将云点数据划分成若干个局部区域。
特征提取：通过PointNet++ 对各个局部区域进行特征提取，获得局部特征。

通过下面的动态图，可以帮助大家更好的理解多级点集特征学习的实现。

图中将Paddle首字母“P”做一个局部坐标，通过PointNet++提取特征，得到一个新的点。重复这个操作，会得到另一个小区域的点。经过一系列操作之后，会得到一组新的点。这组点在数量上少于输入的点，但每个点都代表了周围区域的几何特征。

分类任务（Classification）

类似于传统的图像分类，模型将全局特征送入全连接网络中，最终得到预测的类别概率。

分割任务（Segmentation）

对于语义分割任务，需要从低分辨率特征中上采样还原高分辨率的特征。对于CNN模型，一般是使用2D图像插值的方式实现。PointNet++模型采用提取最近的3个近邻点，并通过这三个点加权平均的方式插值获得上采样点。

此外，PointNet++还因其对输入数据顺序置换的不变性、轻量级结构、对数据丢失非常鲁棒等特征，非常适合工业领域应用。

实验结论

PointNet++模型测试精度如下：

PointRCNN原理和实验表现

3D目标检测模型PointRCNN借鉴了PointNet++和RCNN的思想，提出了自底向上的生成和调整候选检测区域的算法，网络结构如下图所示：

PointRCNN的网络结构分为两个阶段：第一阶段自底向上生成3D候选预测框；第二阶段在规范坐标中对候选预测框进行搜索和微调，得到更为精确的预测框作为检测结果。

第一阶段：对3D点云数据进行语义分割和前背景划分，生成候选预测框，有如下三个关键步骤：

点云特征提取：通过PointNet++对点云数据进行编码和解码，提取点云特征向量。
前景点分割：根据提取的点云特征向量，使用focal loss区分前景点和背景点。focal loss能有效地平衡前景点和背景点比例失衡问题，从而得到更为准确的分类效果。
生成候选框：采用候选框箱模型（bin）的方法，将前背景点分割信息生成预测候选框。

举例来说，将候选框定义为参数（x，y，z，h，w，l，θ）表征的空间中的箱体，其中（x，y，z）为箱体中心坐标，（ h，w，l）为箱体在中心坐标方向上的大小，θ为鸟瞰视角上（y方向从上往下看）箱体在x-z平面的角度。

bin的执行方式为：先根据前景点的分割信息粗分其所属的箱体；再在箱体内部对其做回归，得到箱体参数作为预测框；最后对预测框做NMS（Non-Max Suppress，非极大值抑制），得到最终预测候选框。

第二阶段：在规范坐标中微调候选预测框，获得最终的检测结果，有如下五个关键部分：

区域池化：对候选框内每个点的特征进行池化。
坐标转化：为了更好地获取局部信息，需要将多个候选区域中的前景点坐标（同一个坐标系）转化为局域坐标系中的规范坐标（以预测框为中心点的多个坐标系），如下图所示：
特征编码：将规范坐标时丢失的深度信息、规范后的坐标信息、前后背景语义信息等经过多层感知机提取特征，作为每个点的编码特征。
微调预测框：经过上一步编码后的特征，经PointNet++网络进行特征提取，最后回归得到局部坐标系下的3D预测框。

实验结论

目前发布的KITTI数据集下Car检测精度如下：

以上就是飞桨１.７发布的PointNet++和PointRCNN模型，基于飞桨框架，开发者可快速实现３Ｄ图像的分类、语义分割和目标检测任务，模型精度持平世界一流水平。欢迎感兴趣的伙伴在PaddleCV的模型库中，在文末的Github地址中获取相关数据集和代码，尝试实现自己的3D应用。（3D模型存在自定义OP，需要在GPU+Linux平台实现）

>> 访问 PaddlePaddle 官网，了解更多相关内容。

下载安装命令 ## CPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle ## GPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu

推荐阅读

lua
优化深度神经网络在低性能硬件上的运行

尽管深度学习带来了广泛的应用前景，其训练通常需要强大的计算资源。然而，并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下（如ARM CPU）高效运行深度神经网络，特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]

蜡笔小新 2024-12-24 08:48:32
lua
聊聊中国人工智能科技产业区域竞争力分析及趋势

原文链接：聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数（2021ÿ ... [详细]

蜡笔小新 2023-10-13 11:56:40
lua
浙大陈姥姥版数据结构：第四章二叉搜索树与平衡二叉树

本文深入探讨了二叉搜索树（Binary Search Tree, BST）及其操作，包括查找、插入和删除节点。同时，文章还介绍了平衡二叉树（AVL树）的概念及调整方法，并详细讨论了如何判断两个序列是否构成相同的二叉搜索树。 ... [详细]

蜡笔小新 2024-12-28 13:49:45
list
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
list
2023年京东Android面试真题解析与经验分享

本文由一位拥有6年Android开发经验的工程师撰写，详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]

蜡笔小新 2024-12-26 17:45:48
list
Codeforces Round #566 (Div. 2) A~F个人题解

Dashboard-CodeforcesRound#566(Div.2)-CodeforcesA.FillingShapes题意：给你一个的表格，你 ... [详细]

蜡笔小新 2024-12-25 18:41:21
spring
PHP Eloquent ORM 中的关联查询扩展

本文探讨了如何在 PHP 的 Eloquent ORM 中实现数据表之间的关联查询，并通过具体示例详细解释了如何将关联数据嵌入到查询结果中。这不仅提高了数据查询的效率，还简化了代码逻辑。 ... [详细]

蜡笔小新 2024-12-25 18:14:14
web
黑客如何利用AI在暗网重建你的数字身份

随着技术的发展，黑客开始利用AI技术在暗网中创建用户的‘数字孪生’，这一现象引起了安全专家的高度关注。 ... [详细]

蜡笔小新 2024-12-12 17:45:26
list
如何在jieba分词中加自定义词典_常见中文分词包比较

1jiebajieba.cut方法接受三个输入参数:需要分词的字符串；cut_all参数用来控制是否采用全模式；HMM参数用来控制是否使用HMM模型ji ... [详细]

蜡笔小新 2024-10-11 12:27:39
list
百度AI Studio人流密度常规赛火热进行中，快来报名！

早晨七点半。北京初秋的凉风叫醒了住在望京西的你，睁开眼睛，一想到又要为人类的信息化事业贡献满满的正能量，你不禁哼唱起那句“早晨起来 ... [详细]

蜡笔小新 2023-10-12 18:57:29
list
vivo Y5s的核心处理器解析

vivo Y5s配备了联发科Helio P65八核处理器，这款处理器采用12纳米工艺制造，具备两颗高性能Cortex-A75核心和六颗高效能Cortex-A55核心。此外，它还集成了先进的图像处理单元和语音唤醒功能，为用户提供卓越的性能体验。 ... [详细]

蜡笔小新 2024-12-21 11:24:54
list
三星Galaxy S8/S8+即将登场，全面解析新旗舰

3月29日晚11点，备受瞩目的三星Galaxy S8/S8+将正式发布。作为三星在Note 7爆炸事件后的重磅产品，S8/S8+不仅承载着恢复消费者信心的重任，其创新的设计和技术也备受期待。 ... [详细]

蜡笔小新 2024-12-18 10:21:02
list
新手指南：在Windows 10上搭建深度学习与PyTorch开发环境

本文详细记录了一名新手在Windows 10操作系统上搭建深度学习环境的过程，包括安装必要的软件和配置环境变量等步骤，旨在帮助同样初入该领域的读者避免常见的错误。 ... [详细]

蜡笔小新 2024-12-17 03:14:23
list
直播提醒 | 电影精准推荐很难吗？搞定经典DSSM经典模型！

点击左上方蓝字关注我们自从小编安装了投影仪，看电影已经变成了日常刚需，而且系统总是可以推荐出令我惊喜的老电影，每一步推荐都“踩”在心头爱。 ... [详细]

蜡笔小新 2023-10-12 22:42:04
list
Jupyter 使用Anaconda 虚拟环境内核

Anaconda虚拟环境中使用JupyterNotebook安装好Anaconda之后，进入AnacondaPrompt，创建虚拟环境， ... [详细]

蜡笔小新 2023-10-12 18:48:11

叶晴琼

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章