2021年,自动驾驶领域格外热闹,互联网大厂、新造车势力和传统企业纷纷进场布局自动驾驶,很多自动驾驶车辆从封闭路测场地走向真实道路。2022年伊始,自动驾驶赛道仍充满速度与激情,伴随着商业化落地的快速渗透,相关咨询机构预测自动驾驶将正式进入商业化元年”。
什么是自动驾驶系统?
自动驾驶系统采用先进的通信、计算机、网络和控制技术,对汽车实现实时、连续控制。自动驾驶系统是一种对驾驶员执行的工作完全自动化、高度集中控制的列车运行系统。自动驾驶系统具有汽车自动唤醒启动和休眠、自动行驶、自动停车、自动开关车门等功能,并配置了多种运行模式,例如常规运行、降级运行、运行中断等多种运行模式,可实现节能结源,优化系统能耗和速度的合理匹配。还可以对自动驾驶汽车上的驾驶员及乘客的状况、车内状况、设备状态进行监视和检测,如发现异常状况会将信息快速传送至控制中心,并及时作出处理。
自动驾驶的五个等级
自动驾驶的等级划分自动驾驶被分为L0-L5 的6个等级。
L0为人工驾驶,即无自动驾驶。由驾驶员全方面操控汽车,可以得到警示或干预系统的辅助;
L1为辅助驾驶,通过驾驶环境对方向盘和加减速中的一项操作提供驾驶支持,其他的驾驶动作都由驾驶员进行操作;
L2为半自动自动驾驶,通过驾驶环境对方向盘和加减速中的多项操作提供驾驶支持,其他的驾驶动作都由驾驶员进行操作;
L3为高度自动驾驶,由自动驾驶系统完成所有的驾驶操作。根据系统要求,驾驶者需要在突发紧急情况时提供应答;
L4为超高度自动驾驶,由自动驾驶系统完成所有的驾驶操作。根据系统要求,驾驶者不一定需要对所有的系统请求做出应答,包括限定道路和环境条件等;
L5为全自动驾驶,在所有驾驶者都能应付的道路和行车环境条件下,都可以由自动驾驶系统自主完成所有的驾驶操作。
L0至L5的核心区别在于汽车的自动化程度,体现在转向与加减速控制、对汽车周围环境的观察、处理紧急突发状况的应变能力。就目前来说,人们还在进行L3、L4级的研发中,离L5全自动驾驶还有一段较长的距离。
数据标注对自动驾驶的重要性
自动驾驶主流算法模型主要以有监督的深度学习方式为主,是基于已知变量和因变量推导函数关系的算法模型,需要大量的结构化标注数据对模型进行训练和调优。
相比其他的人工智能使用场景,自动驾驶对于数据标注有着更高的要求。因为自动驾驶在实际行驶过程中需要面对更多更复杂的场景,会有许多突发状况。当自动驾驶汽车在路面上行驶时,它既需要判断路线的正确性,还需要对路面上的障碍进行识别,在行车过程中,周围的环境变化是很难预料的,因此,为自动驾驶技术提供足够且真实的场景数据是解决自动驾驶技术安全性问题的关键。数据标注的准确性越高,就越能保证大量数据能被正确且合理应用。
自动驾驶领域中常见的数据标注方法
在自动驾驶领域中常见的数据标注方法有:2D框标注,指示牌、信号灯标注,3D立方体标注,车辆多边形标注,3D雷达点云标注,有线段标注,图像语义分割,视频跟踪标注,ASR 转写等。
1、2D框标注
2D框标注被广泛应用于对车辆与行人的识别当中,即对图片中的车辆和行人进行标注,并通过框的属性来开展测试模型。
景联文科技采集标注了《2D拉框标注训练集100000张》,《巡检小车2D标注图像训练集49980张》等直接用于自动驾驶算法研究的数据集。
2、3D立方体标注
3D立方体标注就是对车辆进行3D标注,主要应用于训练自动驾驶对周围行驶的车或超车车辆的体积进行判断。
景联文科技采集标注了《21000张车辆3D立方体标注图像数据集》,可直接用于自动驾驶算法研究。
3、车辆多边形标注
车辆多边形标注可以精准的标注出车辆的形状信息,主要应用于对车辆类型进行识别。
景联文科技采集标注了《23000张车辆多边形标注图像数据集》,可直接用于自动驾驶算法研究。
4、多段线标注
多段线标注多用于对道路地面标线进行的包括分类标注、区域标注和语义标注的一种综合性标注,在智能驾驶场景中被应用在标注车道线,使自动驾驶车辆可以按照车道线的规则进行行驶。
景联文科技采集标注了《24400张多段线标注图像数据集》,可直接用于自动驾驶算法研究。
5、指示牌、信号灯标注
指示牌、信号灯标注是一种对在道路上悬挂的指示牌和信号灯进行的综合标注,标注包括区域标注、语义标注,使自动驾驶能够根据交通规则进行安全的行驶。
景联文采集标注了《10000张指示牌标注图像数据集》、《15000张信号灯标注图像数据集》等数据集,可直接用于自动驾驶算法研究。
6、图像语义分割
语义分割是一种较为广泛的标注,就是对图片中的不同区域进行分割标注,将图像变成带有一定语义信息的色块,并给每个像素都标注上其对应的标签,从而实现从底层到高层的语义推理过程,最终得到一张具有各个像素语义标注信息的分割图像。这些类型可能是“行人,车辆,建筑物,天空,植被等等。这可以很好的帮助智能驾驶车辆识别道路上的可行驶区域。
景联文科技采集标注了《50000张图像语义分割数据集》,可直接用于自动驾驶算法研究。
7、视频跟踪标注
视频跟踪标注是指跟踪标注视频中行驶的车辆,按照图片帧抓取进行标框标注,标注后的照片再按照顺序重新组合排列成视频数据,可以用来训练自动驾驶模型。
景联文科技采集标注了《21400段视频跟踪标注数据集》,可用于自动驾驶算法研究。
8、3D点云标注
3D雷达点云标注是将视频场景通过3D图像来精确描绘出对象形状、运动轨迹等信息,3D雷达点云标注主要被用在自动驾驶虚拟现实的搭建之中。
3D点云连续帧标注是自动驾驶场景中应用较为广泛的一种数据处理标注类型,对三维空间的感知能力以及多帧同时协同处理能力的要求较高,标注时需要关注连续帧对象ID、对象框大小、软性与刚性物体标注标准等内容。
景联文科技采集标注了《24000张车辆行人3D点云标注图像训练集》,对马路采集图片进行3d点云信息数据标注,可直接提供给算法厂家用于研究自动驾驶算法研究。
9、ASR语音转写
ASR语音转写常被用于自动驾驶系统中的语音助手领域,可以很好地协助驾驶员管理和控制车辆。
景联文科技采集标注了《88000段车载唤醒词语音数据集》,在驾驶车内静止环境下,关窗,开发动机,空调2档,主驾位置,麦克风间距140mm的情况下进行采集,可直接用于自动驾驶有关人机交互的算法研究中,大力节约了算法研究厂商的研发时间。
景联文科技为自动驾驶提供数据支持
作为一家专业的数据采集标注公司,景联文在AI数据服务行业有独特的优势,
1.技术优势
景联文科技获得高新技术企业认定,有专业的技术团队,自研数据标注平台,拥有成熟的标注、审核、质检机制,支持计算机视觉(拉框标注、语义分割、3D点云标注、关键点标注、线标注、2D/3D融合标注、目标跟踪、图片分类等)、语音工程(语音切割、ASR语音转写、语音情绪判定、声纹识别标注等)、自然语言处理(OCR转写、文本信息抽取、NLU语句泛化)多类型数据标注,通过预标注的智能化数据处理方式能降低数据标注时间,节约人力成本。
2.服务优势
景联文科技通过数百个真实项目实战,内部形成了完善的标注人才培养系统,从项目经理到质检员到标注员,都要定期进行具体业务场景的标注课程培训,通过层层考核才可以领取标注任务。景联文尤其重视对项目经理的培养,团队项目经理除了熟练掌握工程化数据标注的项目组织、管理和质量控制的技术与方法外,对人工智能技相关术算法也有一定了解,与客户的对接过程中能够高效理解需求快速响应。景联文科技实行管家式服务制,为每一个项目配备专属商务经理和对最熟悉该领域业务的项目经理,提前部署,提前开始,提前交付,针对客户的加急需求提供24小时加班业务,针对客户的驻场需求提供全国各大城市标注人员驻场服务,尽全力为客户提供省心省力省成本的一站式数据方案。
景联文科技提供互联网企业,安防社区,智慧交通驾驶,健康医疗,3C,内容审核六大领域AI数据解决方案,针对智能驾驶训练数据需求提供如下服务。
1.现有数据集出售
在数据获取阶段,景联文现有数据库拥有超过500小时的车载语音交互数据集,覆盖多种车型,天气,道路类型及语音噪音场景,拥有20万张驾驶员乘客行为检测识别数据集,重点包括驾驶员打电话,抽烟等危险行为,动态静态手语手势数据集,部分成品标注训练集即买即用,部分原始数据集也可以根据客户的具体需求进行标注。
2.数据采集
针对更加对场景还原性更高的智能驾驶数据采集项目,不管是驾驶员行为,街景场景,还是车载语音数据,景联文科技都拥有非常丰富的场景搭建能力和项目实施经验,支持自动驾驶场景下驾驶舱内舱外不同类型的数据采集任务,包含多场景,多天气状况,多环境状况,涵盖了覆盖身份认证,活体验证,手势识别,视线追踪,动作识别,动态目标检测,标志牌等多场景,包括不同车型下语音数据采集,多语种车载语音数据集,远场和近场语音数据采集,提供超过50余种语言和方言语料,辅助自动驾驶技术在复杂的环境下感知实际行车道路、车辆位置和周围障碍物信息,可满足自动驾驶领域不同落地场景下的高质量AI训练数据需求。
3.数据标注
景联文科技支持自动驾驶全部类型标注业务,在2D框标注,指示牌、信号灯标注,3D立方体标注,车辆多边形标注,3D雷达点云标注,有线段标注,图像语义分割,视频跟踪标注,ASR 转写等每个业务中都有超过数几十次的标注实战经验。
其中,激光雷达是自动驾驶汽车的核心感知传感器,也是道路上的路侧传感器,3D激光点云标注总体规则基本为完整脑补框,不允许漏点,框需贴合真实形状、类型属性准确、序列中标注框尺寸保持一致,静止时保持稳定无抖动、tracking信息准确、标注尺寸和类型对应、应标尽标等,其本质就是在点云上面拉框调整贴合度和航向角。
景联文科技自建的标注平台支持对点云的渲染与标注,通过对渲染引擎等方面的优化,可流畅使用三维边界框标注点云上的目标,还可标注该目标的类别、行为和置信度,平台还支持点云和图片的深度融合标注,通过对点云上的目标的三维边界框标注,使该帧点云对应的2D图像上的该目标也会被自动标注,点云的精准定位也可助力算法训练。景联文科技拥有丰富的3D点云标注经验,可满足甲方的要求,对数据质量做到全程把控,标注合格率可达99%。
成功案例
案例一、景联文科技于2021年成功中标某头部科技厂商的车辆行人及指示牌信号灯为一体的数据2D拉框标注项目,该项目难度非常大,需要在白天和晚上两种不同环境中的图片上进行标注,总标注图片量达到20万条,框数达到40w个,准确率要达到98%,而且客户要求的交付时间非常紧,工期只有15天,项目难度非常高,
景联文科技的采标团队利用自身完善且快捷的标注平台、稳定且高素质的标注团队,轻松实现2D拉框的快速标注,经过全量质检和两轮抽检三次数据质检后,进行分批提交数据,针对已提交数据所反馈的问题,及时与客户确认,加班对团队进行培训,调整标注规范返修数据。最终该项目在期限内提前足额完成交付,一次合格率达到 99.8%!最终交付数据完美达到客户要求。
案例二、2021年,景联文科技在3D点云领域中,与国内知名自动驾驶车辆企业达成深度合作关系,合作过程中景联文标注点云图片共计3w+帧,合计10w+个点云框,涵盖了高速行驶路段,市区路段,指定测试场地等日常行车环境。
同时景联文科技在标注3D点云过程中非常注重对品质的把控,在合作过程中景联文科技交付的点云标注框合格率达到了99%,对每一帧的点云数据都严格依照参考图片标注,不漏标一个点云标注框,确保交付给客户的每一帧点云都是精心标注后的臻品。
在标注过程中,景联文科技保持着干净利落的一贯作风,严谨排布标注方案,调用一切可用资源,有条不紊的按计划进行数据标注,我们能在客户指定的工期内,提前交付保质保量的数据,对工期进行严格把控。