使用TengineExplore版在fireflyRK3399上实现实时目标检测

作者：搜狐搜不到你的爱_276 | 来源：互联网 | 2023-08-08 12:17

使用深度学习的方法训练得到模型之后，下一步便是将模型部署到实际的应用场景中创造效益，通常就是部署到服务器端，或者部署到移动端，我们做的是后者。近些年来，用于将模型部署到移动端的前向

使用深度学习的方法训练得到模型之后，下一步便是将模型部署到实际的应用场景中创造效益，通常就是部署到服务器端，或者部署到移动端，我们做的是后者。

近些年来，用于将模型部署到移动端的前向推理框架比较多，例如ncnn、MACE、Tengine等，当然如果有条件，还是需要自己来做优化。

Tengine是一个由OPEN AI LAB开发的专门针对嵌入式场景的轻量化框架，我们对比了ncnn、MACE和Tengine之后发现，Tengine的速度是最快的。

前不久，Tengine还推出了Tengine Explore 版，性能比开源版更强。参与Tengine AloT 树莓派/RK3399应用征集大赛，每个开发者可以体验性能非凡的Tengine Explore版。微信扫描以下二维码参与活动：

使用Tengine Explore版在firefly-RK3399上实现实时目标检测
接下来，我们对Tengine开源版，Tengine Explorer版（float32），Tengine Explorer版（int8）三者做一个比较，分别采用图像和视频的方式。

1.1、图像测试，Tengine开源版

运行Tengine Explore版本，首先需要跑通开源版本的Tengine，指导教程可以参考hey-yahei的博客。在这里，我们用RK3399来跑Mobilenet_SSD，得到的结果如下：

使用Tengine Explore版在firefly-RK3399上实现实时目标检测

这里，我们对同一幅图像重复检测100次，取平均时间，可以发现平均一帧耗时176.945ms，速度还是很快的！

1.2、图像测试，Tengine Explorer版（float32）

接下来，我们用Tengine Explore 版来做同样的事情，得到结果如下：
使用Tengine Explore版在firefly-RK3399上实现实时目标检测
可以看到输出多了一行Authentication failed can’t get ID，这是因为这个版本目前尚未在线**，但并不影响其运行。当然在线**之后可以用int8的方式来计算，速度会更快。这次，我们还是使用相同的模型，对同一幅图像检测100次，可以看到，平均时间降低到了142.566ms，速度提升相当可观。

1.3、图像测试，Tengine Explorer版（int8）

接下来，我们将Tengine Explore版进行在线**，解锁int8量化计算的方法。进一步提升运算速度。运行程序得到结果：
使用Tengine Explore版在firefly-RK3399上实现实时目标检测

可以看到精度基本没有损失，但是时间降低到了139.237ms，非常快！

2.1、视频测试，Tengine开源版

接下来，我们基于实际需求来做一些应用。客流检测可以用在商场、公交等行业，实现自动计数，这里第一步就是检测人头。我们的模型在Mobilenet_SSD的基础上进行了压缩、裁剪等工作，在不影响最终效果的前提下减小模型的复杂度。我们用双线程同时处理两个本地视频。结果如下：

使用Tengine Explore版在firefly-RK3399上实现实时目标检测

可以看到视频虽然不是很清晰，光照条件也不是很好，但是模型准确地检测出了视频中的人头，当然，目标的跟踪和计数是检测之后另外实现的。本段视频中，程序检测到上车人数为13人，下车人数为9人，平均一帧耗时大约48ms。

2.2、视频测试，Tengine Explorer版（float32）

然后我们用Tengine Explorer版来做同样的事情，结果如下：
使用Tengine Explore版在firefly-RK3399上实现实时目标检测
可以看到，视频检测的结果跟开源版是一样的，但是平均时间降低到了44ms。

2.3、视频测试，Tengine Explorer版（int8）

最后，我们用Tengine Explore版的int8量化计算的方法，进一步提升运算速度。运行程序得到结果：

使用Tengine Explore版在firefly-RK3399上实现实时目标检测
可以看到，int8得到的目标检测结果和float32的得到的结果差别并不是很大，最终计数的结果为上车人数13人，下车人数8人，两者也都差不多，相信调整参数之后应该就没有问题了，但是int8方式的一帧平均时间降低到了大约34ms，提升相当明显，已经接近实时应用了！当然，这只是一个demo，距离实际应用还有一些距离，需要继续努力。

最后感谢Tengine的开发者，以及举办本次活动的工作人员！

推荐阅读

get
深入理解PHP中的超全局变量与AJAX技术

本文详细介绍了PHP中的几种超全局变量，包括$GLOBAL、$_SERVER、$_POST、$_GET等，并探讨了AJAX的工作原理及其优缺点。通过具体示例，帮助读者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-11-24 16:35:09
get
PHP Memcached 使用详解

本文详细介绍了如何在PHP中使用Memcached进行数据缓存，包括服务器连接、数据操作、高级功能等。 ... [详细]

蜡笔小新 2024-11-24 09:51:34
get
物联网学习之旅：微信小程序控制STM32（三）STM32代码编写

STM32代码编写STM32端不需要写关于连接MQTT服务器的代码，连接的工作交给ESP8266来做，STM32只需要通过串口接收和发送数据，间接的与服务器交互。串口三配置串口一已 ... [详细]

蜡笔小新 2024-11-23 21:37:55
java
如何高效学习鸿蒙操作系统：开发者指南

本文探讨了开发者如何更有效地学习鸿蒙操作系统，提供了来自行业专家的建议，包括系统化学习方法、职业规划建议以及具体的开发技巧。 ... [详细]

蜡笔小新 2024-11-23 19:22:14
get
ArcBlock 发布 ABT 节点 1.0.31 版本更新

2020年11月9日，ArcBlock 区块链基础平台发布了 ABT 节点开发平台的1.0.31版本更新，此次更新带来了多项功能增强与性能优化。 ... [详细]

蜡笔小新 2024-11-22 21:02:58
get
英特尔推出第三代至强可扩展处理器及傲腾持久内存，AI性能显著提升

英特尔在数据创新峰会上发布了第三代至强可扩展处理器和第二代傲腾持久内存，全面增强AI能力和系统性能。 ... [详细]

蜡笔小新 2024-11-17 13:07:14
java
Java 网站开发指南

本文详细介绍了 Java 网站开发的相关资源和步骤，包括常用网站、开发环境和框架选择。 ... [详细]

蜡笔小新 2024-11-14 22:39:58
java
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
get
Quartz 实现 Web 工程动态定时任务调度方案

本文探讨了一个Web工程项目的需求，即允许用户随时添加定时任务，并通过Quartz框架实现这些任务的自动化调度。文章将介绍如何设计任务表以存储任务信息和执行周期，以及如何通过一个定期扫描机制自动识别并加载新任务到调度系统中。 ... [详细]

蜡笔小新 2024-11-24 16:22:58
get
使用jQuery与百度地图API实现地址转经纬度功能

本文详细介绍了如何利用jQuery和百度地图API将地址转换为经纬度，包括申请API密钥、页面构建及核心代码实现。 ... [详细]

蜡笔小新 2024-11-24 14:33:10
get
自动驾驶中的9种传感器融合算法

来源丨AI修炼之路在自动驾驶汽车中，传感器融合是融合来自多个传感器数据的过程。该步骤在机器人技术中是强制性的，因为它提供了更高的可靠性、冗余性以及最终的 ... [详细]

蜡笔小新 2024-11-16 12:07:16
get
使用 Jupyter Notebook 实现 Markdown 编写与代码运行

Jupyter Notebook 是一个开源的基于网页的应用程序，允许用户在同一文档中编写 Markdown 文本和运行多种编程语言的代码，并实时查看运行结果。 ... [详细]

蜡笔小新 2024-11-15 14:50:50
get
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
get
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
get
在Windows系统中安装TensorFlow GPU版的详细指南与常见问题解决

在Windows系统中安装TensorFlow GPU版是许多深度学习初学者面临的挑战。本文详细介绍了安装过程中的每一个步骤，并针对常见的问题提供了有效的解决方案。通过本文的指导，读者可以顺利地完成安装并避免常见的陷阱。 ... [详细]

蜡笔小新 2024-11-11 19:02:49

搜狐搜不到你的爱_276

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章