热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

大疆车载从多家数据库中选定TDengine

大疆车载从多家数据库中选定TDengine-小T导读:为了满足智能驾驶业务的数据处理需求,大疆车载试图从多家数据库中进行选型调研,帮助智能驾驶业务提升写入查询性能、降低运维成本。本
小 T 导读:为了满足智能驾驶业务的数据处理需求,大疆车载试图从多家数据库中进行选型调研,帮助智能驾驶业务提升写入查询性能、降低运维成本。本文将分享大疆车载在数据库选型、系统搭建和业务迁移等方面的经验。

根据国家发改委、科技部、工信部等 11 个部门联合印发的《智能汽车创新发展战略》,到 2025 年,中国标准智能汽车的技术创新、产业生态、基础设施、法规标准、产品监管和网络安全体系基本形成。同时,实现有条件智能驾驶的智能汽车达到规模化生产,实现高度智能驾驶的智能汽车在特定环境下市场化应用。目前,随着我国正在积极发展智能网联汽车,无人驾驶技术进一步推动,互联网巨头企业进入市场、加大投入研发技术,无人驾驶市场正处于快速发展阶段。无人机头部企业大疆车载也在去年 4 月份宣布进入智能驾驶领域。

由于当前的智能驾驶业务还是新的业务场景,所以大疆车载在选型上的历史负担相对较轻。在 Database 选型要求上,从业务需求出发,主要聚焦在两点:首先,结合当下的业务场景,需要满足单台车辆的高频消息上报频率;其次,支持在数据量大的时候,通过聚合函数,或选择函数来快速筛选出需要的数据。

此外,对数据库要求支持集群部署的同时,也要求更低的查询语句编写上手难度;而且需支持单表千万量级,在海量数据并发场景下,需要有较高的统计报表能力和较好的查询 SQL 效率;最后通过数据压缩、运维成本和并发能力上的考量,最终选定 TDengine 来存储海量数据。

综合来看,TDengine 满足需求的主要原因如下:

  • 国产、开源的时序数据库(Time Series Database)
  • 开源版支持分布式集群,方便扩展
  • 列式存储,数据压缩比率高,读写性能优秀
  • 一个设备一张表,对应我们一个车辆一张表,模型契合
  • 超级表对于分组聚合查询的强大支持能力

TDengine 建表思路

作为智能驾驶领域的创新者之一,大疆车载为汽车主机厂提供了软硬一体的智能驾驶解决方案。其中,车辆云端平台负责对车辆状态信息进行监控,具体包括 GPS、速度、转速、里程等,经由 MQTT 流转到 TDengine 存储,满足车辆历史轨迹回放和车辆实时状态监控。

车辆消息样例数据展示如下:

{"message_id": "a78b6d9a","device_key": "deviceKey2","ts": "2022-03-01 15:01:59","longitude": 123.9795647512915,"latitude": 21.58338210717887,"altitude": 51.47800064086914,"signal_strength": 12,"satellites_in_view": 21,"speed": 72.798225,"acceleration": 12,"rpm":2190,"gear": "D","direction": -91.32959,"mileage": 10020,"ip": "10.1.2.3","create_time": "2022-03-01 15:02:03",}

落脚到实际业务上,我们搭建的表结构如下:

我们落地使用的是 TDengine 2.2.1.3 单机版 ,按照车辆唯一的标识 DeviceKey 来创建子表,如 device_stat_$deviceKey,一个车辆的状态信息都存在一张子表中。mqtt_msg 超级表也是一样的逻辑,也是以 DeviceKey 来创建子表。

架构与迁移

除了上报的 GPS、速度等,App 端还会和车辆/设备之间进行大量的命令交互,如下发车辆指令操作,这些我们也是使用 TDengine 来进行存储和链路追踪的。具体到链路消息追踪的使用上,我们会将设备与云端、云端与 App 之间双向通信的 MQTT 消息转发到 Kafka 消息队列中,然后业务系统进行消费解析,得到 TraceID、消息 ID、消息版本、消息类型、消息时间戳、消息内容等不同字段的数据,然后将其写入 TDengine 的 mqtt_msg 超级表当中。

除了写入以外,我们也有一定量的查询操作,但是整体上还是以写入为主,目前 TDengine 的性能完全可以满足我们的需求。不过文本类的检索并不是 TDengine 最擅长的场景,于是我们接入了 ES 提供部分服务。

由于是项目初期,目前我们暂时还在使用 TDengine 和 MySQL 双写新数据,把 MySQL 的 SQL 和 TDengine 的 SQL 做了映射关系,从而实现将历史数据以日志回放的方式迁移到 TDengine 中去。因此,目前两个库暂时可以互为备份,后面等业务完全迁移后,我们就可以使用 TDengine 的集群多副本功能来完成数据备份了。

此外,涛思数据的工作人员也提供了另外两种数据迁移方案供我们参考:一是利用 csv 文件的导出导入。二则是基于一款开源的数据库迁移工具 DataX,该工具目前已经完成了关系型数据库(Relational Database)到 TDengine 的适配,实现了 TDengineReader 和 TDengineWriter 两个插件,迁移时只要做好相应的 json 文件配置即可。

性能展示

在应用 TDengine 之后,车辆的实时状态查询变得十分简单,具体展示如下:

  1. 查询单个车辆的上报的最新位置状态
select last_row(*) from device_stat_deJgTAEzInsZeGLM\G;

  1. 多个车辆的最新位置状态查询
select last_row(*) from device_stat where device_key in ('mpVOGpaHqAxGiHWo','HEChzTCZeIWSUysB','HgsIdzvJPeFlVDuT','LVaPHOXkEeTGjTpm','PFHnQCkcXCIBnbsC') group by device_key;

对于车辆历史时间区间内的状态查询,也可以极快地返回结果,用以进行前端分析。

select * from device_stat_mpVOGpaHqAxGiHWo where ts >'2022-03-17 00:00:00' and ts <'2022-03-18 00:00:00';

  1. 进行 MQTT 消息追踪时,查询 MQTT Broker 收发的最新消息

select last_row(*) from mqtt_msg\G;

  1. 按照 requestId 进行消息追踪
select * from mqtt_msg where request_id = 'f90c46d4-22a3-4ab9-b50a-aad8b237fc57'\G;

  1. 时间区间内消息查询
select * from mqtt_msg where ts >'2022-03-18 12:00:00' and ts <'2022-03-18 13:00:00';

通过以上的查询情况汇总可以看出,TDengine 实现了一些选择特定数据的查询和轻量的查询,全部都是毫秒级返回数据,即便是 30000+ 行数据的查询,消耗也只在 1.1 秒左右。

写在最后

在当前的云端平台中,TDengine 的应用不仅节约了存储成本和开发学习成本,同时也表现出了很好的写入读取性能,满足了智能驾驶云端平台海量时序数据的处理需求。

未来我们会对海量时空数据的应用场景进行持续探索和挖掘,对于 TDengine 我们也有更多的期许,希望它能:

  • 在空间数据的读写上有新的特性和更好的支持
  • 拥有更加丰富的认证授权机制,提供更细粒度的权限管控
  • 系统性地丰富各类日志,协助更快地定位问题

最后,祝愿 TDengine 越来越好,能够在中国庞大的时序数据处理场景中脱颖而出,成为国产数据库中的精品!


想了解更多 TDengine Database的具体细节,欢迎大家在GitHub上查看相关源代码。


推荐阅读
  • 七大策略降低云上MySQL成本
    在全球经济放缓和通胀压力下,降低云环境中MySQL数据库的运行成本成为企业关注的重点。本文提供了一系列实用技巧,旨在帮助企业有效控制成本,同时保持高效运作。 ... [详细]
  • 本文探讨了如何通过Service Locator模式来简化和优化在B/S架构中的服务命名访问,特别是对于需要频繁访问的服务,如JNDI和XMLNS。该模式通过缓存机制减少了重复查找的成本,并提供了对多种服务的统一访问接口。 ... [详细]
  • 流处理中的计数挑战与解决方案
    本文探讨了在流处理中进行计数的各种技术和挑战,并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性,还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]
  • 电商高并发解决方案详解
    本文以京东为例,详细探讨了电商中常见的高并发解决方案,包括多级缓存和Nginx限流技术,旨在帮助读者更好地理解和应用这些技术。 ... [详细]
  • Maven + Spring + MyBatis + MySQL 环境搭建与实例解析
    本文详细介绍如何使用MySQL数据库进行环境搭建,包括创建数据库表并插入示例数据。随后,逐步指导如何配置Maven项目,整合Spring框架与MyBatis,实现高效的数据访问。 ... [详细]
  • 如何将955万数据表的17秒SQL查询优化至300毫秒
    本文详细介绍了通过优化SQL查询策略,成功将一张包含955万条记录的财务流水表的查询时间从17秒缩短至300毫秒的方法。文章不仅提供了具体的SQL优化技巧,还深入探讨了背后的数据库原理。 ... [详细]
  • OBS Studio自动化实践:利用脚本批量生成录制场景
    本文探讨了如何利用OBS Studio进行高效录屏,并通过脚本实现场景的自动生成。适合对自动化办公感兴趣的读者。 ... [详细]
  • java类名的作用_java下Class.forName的作用是什么,为什么要使用它?
    湖上湖返回与带有给定字符串名的类或接口相关联的Class对象。调用此方法等效于:Class.forName(className,true,currentLoader) ... [详细]
  • 本文详细探讨了在Web开发中常见的UTF-8编码问题及其解决方案,包括HTML页面、PHP脚本、MySQL数据库以及JavaScript和Flash应用中的乱码问题。 ... [详细]
  • 本文详细介绍了如何在Apache Kafka中进行Topic级别的配置,包括创建、修改和删除配置参数的具体步骤,并提供了详细的配置属性表。 ... [详细]
  • PGXC中的两阶段提交机制及其对事务一致性的保障
    PGXC作为一款基于PostgreSQL的分布式数据库系统,利用Sharding技术将数据分散存储于多个数据库实例中。本文探讨了PGXC的两阶段提交过程及其实现事务强一致性的方法。 ... [详细]
  • 深入解析:存储技术的演变与发展
    本文探讨了从单机文件系统到分布式文件系统的存储技术发展过程,详细解释了各种存储模型及其特点。 ... [详细]
  • 在 Ubuntu 22.04 LTS 上部署 Jira 敏捷项目管理工具
    Jira 敏捷项目管理工具专为软件开发团队设计,旨在以高效、有序的方式管理项目、问题和任务。该工具提供了灵活且可定制的工作流程,能够根据项目需求进行调整。本文将详细介绍如何在 Ubuntu 22.04 LTS 上安装和配置 Jira。 ... [详细]
  • 如题:2017年10月分析:还记得在没有智能手机的年代大概就是12年前吧,手机上都会有WAP浏览器。当时没接触网络原理,也不 ... [详细]
  • 在Java开发中,保护代码安全是一个重要的课题。由于Java字节码容易被反编译,因此使用代码混淆工具如ProGuard变得尤为重要。本文将详细介绍如何使用ProGuard进行代码混淆,以及其基本原理和常见问题。 ... [详细]
author-avatar
天高云淡-tgyd
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有