大疆车载从多家数据库中选定TDengine

作者：天高云淡-tgyd | 来源：互联网 | 2023-05-29 09:39

大疆车载从多家数据库中选定TDengine-小T导读：为了满足智能驾驶业务的数据处理需求，大疆车载试图从多家数据库中进行选型调研，帮助智能驾驶业务提升写入查询性能、降低运维成本。本

小 T 导读：为了满足智能驾驶业务的数据处理需求，大疆车载试图从多家数据库中进行选型调研，帮助智能驾驶业务提升写入查询性能、降低运维成本。本文将分享大疆车载在数据库选型、系统搭建和业务迁移等方面的经验。

根据国家发改委、科技部、工信部等 11 个部门联合印发的《智能汽车创新发展战略》，到 2025 年，中国标准智能汽车的技术创新、产业生态、基础设施、法规标准、产品监管和网络安全体系基本形成。同时，实现有条件智能驾驶的智能汽车达到规模化生产，实现高度智能驾驶的智能汽车在特定环境下市场化应用。目前，随着我国正在积极发展智能网联汽车，无人驾驶技术进一步推动，互联网巨头企业进入市场、加大投入研发技术，无人驾驶市场正处于快速发展阶段。无人机头部企业大疆车载也在去年 4 月份宣布进入智能驾驶领域。

由于当前的智能驾驶业务还是新的业务场景，所以大疆车载在选型上的历史负担相对较轻。在 Database 选型要求上，从业务需求出发，主要聚焦在两点：首先，结合当下的业务场景，需要满足单台车辆的高频消息上报频率；其次，支持在数据量大的时候，通过聚合函数，或选择函数来快速筛选出需要的数据。

此外，对数据库要求支持集群部署的同时，也要求更低的查询语句编写上手难度；而且需支持单表千万量级，在海量数据并发场景下，需要有较高的统计报表能力和较好的查询 SQL 效率；最后通过数据压缩、运维成本和并发能力上的考量，最终选定 TDengine 来存储海量数据。

综合来看，TDengine 满足需求的主要原因如下：

国产、开源的时序数据库（Time Series Database）
开源版支持分布式集群，方便扩展
列式存储，数据压缩比率高，读写性能优秀
一个设备一张表，对应我们一个车辆一张表，模型契合
超级表对于分组聚合查询的强大支持能力

TDengine 建表思路

作为智能驾驶领域的创新者之一，大疆车载为汽车主机厂提供了软硬一体的智能驾驶解决方案。其中，车辆云端平台负责对车辆状态信息进行监控，具体包括 GPS、速度、转速、里程等，经由 MQTT 流转到 TDengine 存储，满足车辆历史轨迹回放和车辆实时状态监控。

车辆消息样例数据展示如下：

{"message_id": "a78b6d9a","device_key": "deviceKey2","ts": "2022-03-01 15:01:59","longitude": 123.9795647512915,"latitude": 21.58338210717887,"altitude": 51.47800064086914,"signal_strength": 12,"satellites_in_view": 21,"speed": 72.798225,"acceleration": 12,"rpm":2190,"gear": "D","direction": -91.32959,"mileage": 10020,"ip": "10.1.2.3","create_time": "2022-03-01 15:02:03",}

落脚到实际业务上，我们搭建的表结构如下：

我们落地使用的是 TDengine 2.2.1.3 单机版，按照车辆唯一的标识 DeviceKey 来创建子表，如 device_stat_$deviceKey，一个车辆的状态信息都存在一张子表中。mqtt_msg 超级表也是一样的逻辑，也是以 DeviceKey 来创建子表。

架构与迁移

除了上报的 GPS、速度等，App 端还会和车辆/设备之间进行大量的命令交互，如下发车辆指令操作，这些我们也是使用 TDengine 来进行存储和链路追踪的。具体到链路消息追踪的使用上，我们会将设备与云端、云端与 App 之间双向通信的 MQTT 消息转发到 Kafka 消息队列中，然后业务系统进行消费解析，得到 TraceID、消息 ID、消息版本、消息类型、消息时间戳、消息内容等不同字段的数据，然后将其写入 TDengine 的 mqtt_msg 超级表当中。

除了写入以外，我们也有一定量的查询操作，但是整体上还是以写入为主，目前 TDengine 的性能完全可以满足我们的需求。不过文本类的检索并不是 TDengine 最擅长的场景，于是我们接入了 ES 提供部分服务。

由于是项目初期，目前我们暂时还在使用 TDengine 和 MySQL 双写新数据，把 MySQL 的 SQL 和 TDengine 的 SQL 做了映射关系，从而实现将历史数据以日志回放的方式迁移到 TDengine 中去。因此，目前两个库暂时可以互为备份，后面等业务完全迁移后，我们就可以使用 TDengine 的集群多副本功能来完成数据备份了。

此外，涛思数据的工作人员也提供了另外两种数据迁移方案供我们参考：一是利用 csv 文件的导出导入。二则是基于一款开源的数据库迁移工具 DataX，该工具目前已经完成了关系型数据库（Relational Database）到 TDengine 的适配，实现了 TDengineReader 和 TDengineWriter 两个插件，迁移时只要做好相应的 json 文件配置即可。

性能展示

在应用 TDengine 之后，车辆的实时状态查询变得十分简单，具体展示如下：

查询单个车辆的上报的最新位置状态

select last_row(*) from device_stat_deJgTAEzInsZeGLM\G;

多个车辆的最新位置状态查询

select last_row(*) from device_stat where device_key in ('mpVOGpaHqAxGiHWo','HEChzTCZeIWSUysB','HgsIdzvJPeFlVDuT','LVaPHOXkEeTGjTpm','PFHnQCkcXCIBnbsC') group by device_key;

对于车辆历史时间区间内的状态查询，也可以极快地返回结果，用以进行前端分析。

select * from device_stat_mpVOGpaHqAxGiHWo where ts >'2022-03-17 00:00:00' and ts <'2022-03-18 00:00:00';

进行 MQTT 消息追踪时，查询 MQTT Broker 收发的最新消息

select last_row(*) from mqtt_msg\G;

按照 requestId 进行消息追踪

select * from mqtt_msg where request_id = 'f90c46d4-22a3-4ab9-b50a-aad8b237fc57'\G;

时间区间内消息查询

select * from mqtt_msg where ts >'2022-03-18 12:00:00' and ts <'2022-03-18 13:00:00';

通过以上的查询情况汇总可以看出，TDengine 实现了一些选择特定数据的查询和轻量的查询，全部都是毫秒级返回数据，即便是 30000+ 行数据的查询，消耗也只在 1.1 秒左右。

写在最后

在当前的云端平台中，TDengine 的应用不仅节约了存储成本和开发学习成本，同时也表现出了很好的写入读取性能，满足了智能驾驶云端平台海量时序数据的处理需求。

未来我们会对海量时空数据的应用场景进行持续探索和挖掘，对于 TDengine 我们也有更多的期许，希望它能：

在空间数据的读写上有新的特性和更好的支持
拥有更加丰富的认证授权机制，提供更细粒度的权限管控
系统性地丰富各类日志，协助更快地定位问题

最后，祝愿 TDengine 越来越好，能够在中国庞大的时序数据处理场景中脱颖而出，成为国产数据库中的精品！

想了解更多 TDengine Database的具体细节，欢迎大家在GitHub上查看相关源代码。

推荐阅读

hash
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
spring
深入解析 Apache Shiro 安全框架架构

本文详细介绍了 Apache Shiro，一个强大且灵活的开源安全框架。Shiro 专注于简化身份验证、授权、会话管理和加密等复杂的安全操作，使开发者能够更轻松地保护应用程序。其核心目标是提供易于使用和理解的API，同时确保高度的安全性和灵活性。 ... [详细]

蜡笔小新 2024-12-25 16:03:57
python
技术变现之道：从日常工作中挖掘潜力

本文探讨了如何在日常工作中通过优化效率和深入研究核心技术，将技术和知识转化为实际收益。文章结合个人经验，分享了提高工作效率、掌握高价值技能以及选择合适工作环境的方法，帮助读者更好地实现技术变现。 ... [详细]

蜡笔小新 2024-12-24 15:21:23
python
FinOps 与 Serverless 的结合：破解云成本难题

本文探讨了如何通过 FinOps 实践优化 Serverless 应用的成本管理，提出了首个 Serverless 函数总成本估计模型，并分享了多种有效的成本优化策略。 ... [详细]

蜡笔小新 2024-12-24 12:44:26
python
Valve 发布 Steam Deck 的新版 Windows 驱动程序

Valve 最新发布了针对 Steam Deck 掌机的 Windows 驱动程序，旨在提升其在 Windows 环境下的兼容性、安全性和性能表现。 ... [详细]

蜡笔小新 2024-12-28 10:31:16
get
移动 UI 设计基础：打造简洁高效的用户界面

本章将深入探讨移动 UI 设计的核心原则，帮助开发者构建简洁、高效且用户友好的界面。通过学习设计规则和用户体验优化技巧，您将能够创建出既美观又实用的移动应用。 ... [详细]

蜡笔小新 2024-12-27 08:43:40
php
深入解析Netty中的Future机制

本文详细探讨了Netty中Future及其子类的设计与实现，包括其在并发编程中的作用和具体应用场景。我们将介绍Future的继承体系、关键方法的实现细节，并讨论如何通过监听器和回调机制来处理异步任务的结果。 ... [详细]

蜡笔小新 2024-12-26 20:12:47
php
MySQL缓存机制深度解析

本文详细探讨了MySQL的缓存机制，包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术，读者可以更好地优化数据库性能。 ... [详细]

蜡笔小新 2024-12-26 15:15:06
php
牛客携手阿里云，提升全球在线面试体验

通过与阿里云的合作，牛客网成功解决了跨国视频面试中的网络卡顿问题，为求职者和面试官提供了更加流畅的沟通体验。 ... [详细]

蜡笔小新 2024-12-26 06:14:52
get
并发编程：深入理解设计原理与优化

本文探讨了并发编程中的关键设计原则，特别是Java内存模型（JMM）的happens-before规则及其对多线程编程的影响。文章详细介绍了DCL双重检查锁定模式的问题及解决方案，并总结了不同处理器和内存模型之间的关系，旨在为程序员提供更深入的理解和最佳实践。 ... [详细]

蜡笔小新 2024-12-26 01:14:06
int
对MariaDB未来发展的思考与担忧

本文探讨了MariaDB在当前数据库市场中的地位和挑战，分析其可能面临的困境，并提出了对未来发展的几点看法。 ... [详细]

蜡笔小新 2024-12-25 18:20:32
spring
Spring Boot 服务的最大并发处理能力

本文探讨了 Spring Boot 应用程序在不同配置下支持的最大并发连接数，重点分析了内置服务器（如 Tomcat、Jetty 和 Undertow）的默认设置及其对性能的影响。 ... [详细]

蜡笔小新 2024-12-25 16:45:57
copy
Java多线程并发控制：解决相同key的线程互斥问题

本文探讨了在Java多线程环境下，如何确保具有相同key值的线程能够互斥执行并按顺序输出结果。通过优化代码结构和使用线程安全的数据结构，我们解决了线程同步问题，并实现了预期的并发行为。 ... [详细]

蜡笔小新 2024-12-25 14:15:29
int
C++面试高频题

作者：守望者1028链接：https:www.nowcoder.comdiscuss55353来源：牛客网面试高频题：校招过程中参考过牛客诸位大佬的面经，但是具体哪一块是参考谁的我 ... [详细]

蜡笔小新 2024-12-25 12:32:36
config
通过Web界面管理Linux日志的解决方案

本指南介绍了一种利用rsyslog、MariaDB和LogAnalyzer搭建集中式日志管理平台的方法，使用户可以通过Web界面查看和分析Linux系统的日志记录。此方案不仅适用于服务器环境，还提供了详细的步骤来确保系统的稳定性和安全性。 ... [详细]

蜡笔小新 2024-12-24 17:11:38

天高云淡-tgyd

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章