热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

2022自动驾驶迎来商业化元年,景联文科技如何打造数据引擎?

2021年,自动驾驶领域格外热闹,互联网大厂、新造车势力和传统企业纷纷进场布局自动驾驶,很多自动驾驶车辆从封闭路测场地走向真实道路。202

2021年,自动驾驶领域格外热闹,互联网大厂、新造车势力和传统企业纷纷进场布局自动驾驶,很多自动驾驶车辆从封闭路测场地走向真实道路。2022年伊始,自动驾驶赛道仍充满速度与激情,伴随着商业化落地的快速渗透,相关咨询机构预测自动驾驶将正式进入商业化元年”。

什么是自动驾驶系统

自动驾驶系统采用先进的通信、计算机、网络和控制技术,对汽车实现实时、连续控制。自动驾驶系统是一种对驾驶员执行的工作完全自动化、高度集中控制的列车运行系统。自动驾驶系统具有汽车自动唤醒启动和休眠、自动行驶、自动停车、自动开关车门等功能,并配置了多种运行模式,例如常规运行、降级运行、运行中断等多种运行模式,可实现节能结源,优化系统能耗和速度的合理匹配。还可以对自动驾驶汽车上的驾驶员及乘客的状况、车内状况、设备状态进行监视和检测,如发现异常状况会将信息快速传送至控制中心,并及时作出处理。

自动驾驶的五个等级

自动驾驶的等级划分自动驾驶被分为L0-L5 的6个等级。

L0为人工驾驶,即无自动驾驶。由驾驶员全方面操控汽车,可以得到警示或干预系统的辅助;

L1为辅助驾驶,通过驾驶环境对方向盘和加减速中的一项操作提供驾驶支持,其他的驾驶动作都由驾驶员进行操作;

L2为半自动自动驾驶,通过驾驶环境对方向盘和加减速中的多项操作提供驾驶支持,其他的驾驶动作都由驾驶员进行操作;

L3为高度自动驾驶,由自动驾驶系统完成所有的驾驶操作。根据系统要求,驾驶者需要在突发紧急情况时提供应答;

L4为超高度自动驾驶,由自动驾驶系统完成所有的驾驶操作。根据系统要求,驾驶者不一定需要对所有的系统请求做出应答,包括限定道路和环境条件等;

L5为全自动驾驶,在所有驾驶者都能应付的道路和行车环境条件下,都可以由自动驾驶系统自主完成所有的驾驶操作。

L0至L5的核心区别在于汽车的自动化程度,体现在转向与加减速控制、对汽车周围环境的观察、处理紧急突发状况的应变能力。就目前来说,人们还在进行L3、L4级的研发中,离L5全自动驾驶还有一段较长的距离。

数据标注对自动驾驶的重要性

自动驾驶主流算法模型主要以有监督的深度学习方式为主,是基于已知变量和因变量推导函数关系的算法模型,需要大量的结构化标注数据对模型进行训练和调优。

相比其他的人工智能使用场景,自动驾驶对于数据标注有着更高的要求。因为自动驾驶在实际行驶过程中需要面对更多更复杂的场景,会有许多突发状况。当自动驾驶汽车在路面上行驶时,它既需要判断路线的正确性,还需要对路面上的障碍进行识别,在行车过程中,周围的环境变化是很难预料的,因此,为自动驾驶技术提供足够且真实的场景数据是解决自动驾驶技术安全性问题的关键。数据标注的准确性越高,就越能保证大量数据能被正确且合理应用。

自动驾驶领域中常见的数据标注方法

在自动驾驶领域中常见的数据标注方法有:2D框标注,指示牌、信号灯标注,3D立方体标注,车辆多边形标注,3D雷达点云标注,有线段标注,图像语义分割,视频跟踪标注,ASR 转写等。

1、2D框标注

2D框标注被广泛应用于对车辆与行人的识别当中,即对图片中的车辆和行人进行标注,并通过框的属性来开展测试模型。

景联文科技采集标注了《2D拉框标注训练集100000张》,《巡检小车2D标注图像训练集49980张》等直接用于自动驾驶算法研究的数据集。

2、3D立方体标注

3D立方体标注就是对车辆进行3D标注,主要应用于训练自动驾驶对周围行驶的车或超车车辆的体积进行判断。

景联文科技采集标注了《21000张车辆3D立方体标注图像数据集》,可直接用于自动驾驶算法研究。

3、车辆多边形标注

车辆多边形标注可以精准的标注出车辆的形状信息,主要应用于对车辆类型进行识别。

景联文科技采集标注了《23000张车辆多边形标注图像数据集》,可直接用于自动驾驶算法研究。

4、多段线标注

多段线标注多用于对道路地面标线进行的包括分类标注、区域标注和语义标注的一种综合性标注,在智能驾驶场景中被应用在标注车道线,使自动驾驶车辆可以按照车道线的规则进行行驶。

景联文科技采集标注了《24400张多段线标注图像数据集》,可直接用于自动驾驶算法研究。

5、指示牌、信号灯标注

指示牌、信号灯标注是一种对在道路上悬挂的指示牌和信号灯进行的综合标注,标注包括区域标注、语义标注,使自动驾驶能够根据交通规则进行安全的行驶。

景联文采集标注了《10000张指示牌标注图像数据集》、《15000张信号灯标注图像数据集》等数据集,可直接用于自动驾驶算法研究。

6、图像语义分割

语义分割是一种较为广泛的标注,就是对图片中的不同区域进行分割标注,将图像变成带有一定语义信息的色块,并给每个像素都标注上其对应的标签,从而实现从底层到高层的语义推理过程,最终得到一张具有各个像素语义标注信息的分割图像。这些类型可能是“行人,车辆,建筑物,天空,植被等等。这可以很好的帮助智能驾驶车辆识别道路上的可行驶区域。

景联文科技采集标注了《50000张图像语义分割数据集》,可直接用于自动驾驶算法研究。

7、视频跟踪标注

视频跟踪标注是指跟踪标注视频中行驶的车辆,按照图片帧抓取进行标框标注,标注后的照片再按照顺序重新组合排列成视频数据,可以用来训练自动驾驶模型。

景联文科技采集标注了《21400段视频跟踪标注数据集》,可用于自动驾驶算法研究。

8、3D点云标注

3D雷达点云标注是将视频场景通过3D图像来精确描绘出对象形状、运动轨迹等信息,3D雷达点云标注主要被用在自动驾驶虚拟现实的搭建之中。

3D点云连续帧标注是自动驾驶场景中应用较为广泛的一种数据处理标注类型,对三维空间的感知能力以及多帧同时协同处理能力的要求较高,标注时需要关注连续帧对象ID、对象框大小、软性与刚性物体标注标准等内容。

景联文科技采集标注了《24000张车辆行人3D点云标注图像训练集》,对马路采集图片进行3d点云信息数据标注,可直接提供给算法厂家用于研究自动驾驶算法研究。

9、ASR语音转写

ASR语音转写常被用于自动驾驶系统中的语音助手领域,可以很好地协助驾驶员管理和控制车辆。

景联文科技采集标注了《88000段车载唤醒词语音数据集》,在驾驶车内静止环境下,关窗,开发动机,空调2档,主驾位置,麦克风间距140mm的情况下进行采集,可直接用于自动驾驶有关人机交互的算法研究中,大力节约了算法研究厂商的研发时间。

景联文科技为自动驾驶提供数据支持

作为一家专业的数据采集标注公司,景联文在AI数据服务行业有独特的优势,

1.技术优势

景联文科技获得高新技术企业认定,有专业的技术团队,自研数据标注平台,拥有成熟的标注、审核、质检机制,支持计算机视觉(拉框标注、语义分割、3D点云标注、关键点标注、线标注、2D/3D融合标注、目标跟踪、图片分类等)、语音工程(语音切割、ASR语音转写、语音情绪判定、声纹识别标注等)、自然语言处理(OCR转写、文本信息抽取、NLU语句泛化)多类型数据标注,通过预标注的智能化数据处理方式能降低数据标注时间,节约人力成本。

2.服务优势

景联文科技通过数百个真实项目实战,内部形成了完善的标注人才培养系统,从项目经理到质检员到标注员,都要定期进行具体业务场景的标注课程培训,通过层层考核才可以领取标注任务。景联文尤其重视对项目经理的培养,团队项目经理除了熟练掌握工程化数据标注的项目组织、管理和质量控制的技术与方法外,对人工智能技相关术算法也有一定了解,与客户的对接过程中能够高效理解需求快速响应。景联文科技实行管家式服务制,为每一个项目配备专属商务经理和对最熟悉该领域业务的项目经理,提前部署,提前开始,提前交付,针对客户的加急需求提供24小时加班业务,针对客户的驻场需求提供全国各大城市标注人员驻场服务,尽全力为客户提供省心省力省成本的一站式数据方案。

景联文科技提供互联网企业,安防社区,智慧交通驾驶,健康医疗,3C,内容审核六大领域AI数据解决方案,针对智能驾驶训练数据需求提供如下服务。

1.现有数据集出售

在数据获取阶段,景联文现有数据库拥有超过500小时的车载语音交互数据集,覆盖多种车型,天气,道路类型及语音噪音场景,拥有20万张驾驶员乘客行为检测识别数据集,重点包括驾驶员打电话,抽烟等危险行为,动态静态手语手势数据集,部分成品标注训练集即买即用,部分原始数据集也可以根据客户的具体需求进行标注。

2.数据采集

针对更加对场景还原性更高的智能驾驶数据采集项目,不管是驾驶员行为,街景场景,还是车载语音数据,景联文科技都拥有非常丰富的场景搭建能力和项目实施经验,支持自动驾驶场景下驾驶舱内舱外不同类型的数据采集任务,包含多场景,多天气状况,多环境状况,涵盖了覆盖身份认证,活体验证,手势识别,视线追踪,动作识别,动态目标检测,标志牌等多场景,包括不同车型下语音数据采集,多语种车载语音数据集,远场和近场语音数据采集,提供超过50余种语言和方言语料,辅助自动驾驶技术在复杂的环境下感知实际行车道路、车辆位置和周围障碍物信息,可满足自动驾驶领域不同落地场景下的高质量AI训练数据需求。

3.数据标注

景联文科技支持自动驾驶全部类型标注业务,在2D框标注,指示牌、信号灯标注,3D立方体标注,车辆多边形标注,3D雷达点云标注,有线段标注,图像语义分割,视频跟踪标注,ASR 转写等每个业务中都有超过数几十次的标注实战经验。

其中,激光雷达是自动驾驶汽车的核心感知传感器,也是道路上的路侧传感器,3D激光点云标注总体规则基本为完整脑补框,不允许漏点,框需贴合真实形状、类型属性准确、序列中标注框尺寸保持一致,静止时保持稳定无抖动、tracking信息准确、标注尺寸和类型对应、应标尽标等,其本质就是在点云上面拉框调整贴合度和航向角。

景联文科技自建的标注平台支持对点云的渲染与标注,通过对渲染引擎等方面的优化,可流畅使用三维边界框标注点云上的目标,还可标注该目标的类别、行为和置信度,平台还支持点云和图片的深度融合标注,通过对点云上的目标的三维边界框标注,使该帧点云对应的2D图像上的该目标也会被自动标注,点云的精准定位也可助力算法训练。景联文科技拥有丰富的3D点云标注经验,可满足甲方的要求,对数据质量做到全程把控,标注合格率可达99%。

成功案例

案例一、景联文科技于2021年成功中标某头部科技厂商的车辆行人及指示牌信号灯为一体的数据2D拉框标注项目,该项目难度非常大,需要在白天和晚上两种不同环境中的图片上进行标注,总标注图片量达到20万条,框数达到40w个,准确率要达到98%,而且客户要求的交付时间非常紧,工期只有15天,项目难度非常高,

景联文科技的采标团队利用自身完善且快捷的标注平台、稳定且高素质的标注团队,轻松实现2D拉框的快速标注,经过全量质检和两轮抽检三次数据质检后,进行分批提交数据,针对已提交数据所反馈的问题,及时与客户确认,加班对团队进行培训,调整标注规范返修数据。最终该项目在期限内提前足额完成交付,一次合格率达到 99.8%!最终交付数据完美达到客户要求。

案例二、2021年,景联文科技在3D点云领域中,与国内知名自动驾驶车辆企业达成深度合作关系,合作过程中景联文标注点云图片共计3w+帧,合计10w+个点云框,涵盖了高速行驶路段,市区路段,指定测试场地等日常行车环境。

同时景联文科技在标注3D点云过程中非常注重对品质的把控,在合作过程中景联文科技交付的点云标注框合格率达到了99%,对每一帧的点云数据都严格依照参考图片标注,不漏标一个点云标注框,确保交付给客户的每一帧点云都是精心标注后的臻品。

在标注过程中,景联文科技保持着干净利落的一贯作风,严谨排布标注方案,调用一切可用资源,有条不紊的按计划进行数据标注,我们能在客户指定的工期内,提前交付保质保量的数据,对工期进行严格把控。


推荐阅读
  • 中国安全防护服务运营分析:视频监控维护服务的未来走向与发展潜力
    本文探讨了视频监控运维服务在中国的发展趋势与潜力。近年来,随着对安全防护需求的不断增加,视频监控系统作为高效、直观且准确的防范工具,逐渐受到政府和企业的高度重视。该系统能够实时呈现设防区域的现场情况,为安全管理和应急响应提供了重要支持。未来,随着技术的不断进步和应用场景的拓展,视频监控运维服务有望迎来更加广阔的发展空间。 ... [详细]
  • 视觉图像的生成机制与英文术语解析
    近期,Google Brain、牛津大学和清华大学等多家研究机构相继发布了关于多层感知机(MLP)在视觉图像分类中的应用成果。这些研究深入探讨了MLP在视觉任务中的工作机制,并解析了相关技术术语,为理解视觉图像生成提供了新的视角和方法。 ... [详细]
  • 第三届人工智能、网络与信息技术国际学术会议(AINIT 2022)
    20223rdInternationalSeminaronArtificialIntelligence,NetworkingandInformationTechnology第三届 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 步入人工智能新时代,掌握这些关键知识点至关重要。AI技术将成为人类的重要辅助工具,不仅能够扩展和增强人类的智能,还能帮助我们实现更加卓越的成就。新一代人工智能技术的发展将为各行各业带来深远的影响,推动社会进步与创新。 ... [详细]
  • 2019年斯坦福大学CS224n课程笔记:深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析
    本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理(NLP)领域的应用,重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析,深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]
  • python绘制拟合回归散点图_机器学习之利用Python进行简单线性回归分析
    前言:在利用机器学习方法进行数据分析时经常要了解变量的相关性,有时还需要对变量进行回归分析。本文首先对人工智能机器学习深度学习、相关分析因果分析回归分析 ... [详细]
  • 本文介绍了实现人工智能的多种方法,并重点探讨了当前最热门的技术——通过深度学习训练神经网络。文章通过具体实例详细解释了神经网络的基本原理及其应用。 ... [详细]
  • 当前物联网领域十大核心技术解析:涵盖哪些关键技术?
    经过近十年的技术革新,物联网已悄然渗透到日常生活中,对社会产生了深远影响。本文将详细解析当前物联网领域的十大核心关键技术,包括但不限于:1. 军事物联网技术,该技术通过先进的感知设备实现战场环境的实时监测与数据传输,提升作战效能和决策效率。其他关键技术还包括传感器网络、边缘计算、大数据分析等,这些技术共同推动了物联网的快速发展和广泛应用。 ... [详细]
  • 本文探讨了利用Python编程语言开发自动化脚本来实现文件的全量和增量备份方法。通过详细分析不同备份策略的特点,文章介绍了如何使用Python标准库中的os和shutil模块来高效地管理和执行备份任务。此外,还提供了示例代码和最佳实践,帮助读者快速掌握自动化备份技术,确保数据的安全性和完整性。 ... [详细]
  • 8月16日,由容联主办,清华大学五道口金融学院和阿里达摩院共同支持的“科技助力金融50人论坛”在深圳成功举办。此次论坛作为通讯云中国行系列活动的重要组成部分,汇聚了行业精英,深入探讨了金融科技的最新趋势和发展机遇,旨在推动金融行业的创新与变革,开启金融未来的新篇章。容联创始人兼CEO在会上发表了重要演讲,分享了公司在金融科技领域的最新成果和未来展望。 ... [详细]
  • 马志强探讨语音识别技术的最新进展与实际应用案例——RTC开发者聚会分享
    本文主要分享【人工智能语音识别技术的研究前沿】,技术文章【马志强:语音识别技术研究进展和应用落地分享丨RTCDevMeetup】为【声网】投稿,如果你遇到RTCDevMeetup相关问题,本文 ... [详细]
  • 欢迎关注我们微信公众号,可以加入我们QQ人工智能行业交流群626784247.01在当前飞速发展的创新步伐中,科技似乎正在积极地解决人类最紧迫的难 ... [详细]
author-avatar
发的好地方
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有