热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

关于人工智能:如何在有限算力下实现智能驾驶多任务高精度识别

近几年,随着主动驾驶、车路协同等概念的日益炽热,地图厂商、传统汽车厂商以及有互联网背景的“造车新权势”纷纷退出了智能降级的摸索之路。为了使智能驾驶更平安更牢靠,实现高精度、实时感知周围环境的技术至关重要,该技术不仅能够精准疾速地辨认车道线、行驶区域、行人、车辆等,而且将车辆行驶路线“画”在高空,为驾

近几年,随着主动驾驶、车路协同等概念的日益炽热,地图厂商、传统汽车厂商以及有互联网背景的“造车新权势”纷纷退出了智能降级的摸索之路。为了使智能驾驶更平安更牢靠,实现高精度、实时感知周围环境的技术至关重要,该技术不仅能够精准疾速地辨认车道线、行驶区域、行人、车辆等,而且将车辆行驶路线“画”在高空,为驾驶人员提供车距监测、行人预警、车道偏离揭示和红绿灯揭示等一系列平安辅助性能,助力驾驶零碎进行高效的决策。

图1 百度地图AR导航性能展现

但在实在产业中,要实现高精度的驾驶环境感知不是一件容易的事,在理论的路况中存在着各种各样的问题:

  • 摄像头采集到的图像会受到树木、修建遮挡以及车辆挪动的影响;
  • 天气多种多样,要适应白天、黑夜、雾天和雨天等;
  • 车道线磨损水平不一,且不同区域的车道线新旧对辨认也有很大的影响。

针对上述场景,本次飞桨产业实际范例库基于实在场景中的车载影像数据,推出了指标检测和车道线宰割多任务处理的智能驾驶感知实际示例,提供从数据筹备、技术计划、模型训练优化,到模型部署的全流程可复用计划,无效解决了不同光照、不同天气等室外简单环境下的指标辨认问题,实用于AR地图导航、机器人教育、厂区主动巡检、主动驾驶等多个产业利用。

⭐我的项目链接⭐

https://github.com/PaddlePaddle/awesome-DeepLearning

所有源码及教程均已开源,欢送大家star激励~

基于深度学习

实现驾驶环境感知

基于深度学习实现驾驶环境感知要对机动车、非机动车、行人以及交通信号灯(红灯, 黄灯, 绿灯,灭灯) 这7类对象进行指标检测, 同时对实车道线、虚车道线和斑马线3类指标进行宰割, 并且要求检测速度不低于20 fps能力进一步端侧移植,因而,如何在无限算力下实现多任务的高精度辨认将会是驾驶环境感知利用最外围的问题。

图2 场景辨认指标阐明

我的项目难点

数据难: 同一个指标(标签)在不同的环境下出现的状态差别大,如实车道线和虚车道线在城乡结合区域难以辨别;数据存在小样本和样本不平衡的问题,车辆行人标签多,红绿灯数据绝对较少。

工作多:须要同时解决检测和宰割两个工作,选模型和优化时要衡量精度与速度两方面。

效率高: 模型要尽量小,训练与预测速度要尽量快,在V100的平台至多实现20fps能力端侧移植。

我的项目计划

针对上述难点,通过对模型性能精度和速度的思考,最终选用了飞桨指标检测套件

PaddleDetection中的PP-YOLOv2和飞桨图像宰割套件。PaddleSeg中的HardNet模型作为Baseline模型进行相应的优化,应用多过程异步解决,进一步晋升了部署性能。

图3 baseline模型抉择策略

计划优化

本次算法设计同时围绕计算效率、不平衡问题、小指标散布、模型稳定性四个方面开展,并针对实在路线场景进行解决。

图4 场景阐明

检测模型优化历程

数据处理:

1、数据为车载记录仪拍摄的路线画面,其指标均为交通指标,尺寸和比例绝对稳固,但常常会受到光照、传感器噪声等因素影响,偶然还会呈现静止含糊,为此在数据加强过程中,调整RandomDistort(随机像素替换) 中参数hue、saturation、contrast、brightness范畴由到[0.8, 1.2],从而使得模型收敛效率显著晋升。

2、为了进步模型的泛化能力,针对车载摄像头的场景,在训练全过程中随机退出albumentations库中的JpegCompression(降画质) 、MotionaBlur(静止含糊)、RandomBrightnessContrast(亮度对比度)等数据加强的办法。

图5 数据加强策略阐明

模型构造优化:

1、模型检测头复现,应用飞桨复现YOLOX Decoupled Head,相比之前的YOLOX Head检测精度晋升了2%。

图6 不同检测头的精度比照

2、在PP-YOLOv2的Matrix nms的处理结果之后减少merge nms,减少保留框地位平滑策略(重叠框地位信息求解平均值),使框的地位更加准确。

图7 更换nms后地位精度示意

宰割模型优化

1、因为我的项目中数据为车载记录仪拍摄的路线画面,宰割的语义都是高空标识,所以在大小、尺寸、色调方面都绝对稳固,因而数据加强不须要太多,只须要能体现肯定的变化规律即可,同时为了防止随机裁剪过程中导致实车道线和虚车道线产生混同,因而在数据中去掉了随机裁剪的数据加强形式。

2、调整模型分辨率:HardNet 1024 (w) 1024(h) ->1056(w) 608(h),训练采纳多尺度 。

我的项目成果

通过一系列的优化,模型实现了对驾驶过程中的机动车、行人、红绿灯、车道线等指标的辨认,最终整体辨认精度达到85%

图8 成果展现阐明

部署优化

一开始应用模型串联的模式,先进行宰割的后处理,但工夫不满足要求。通过进一步优化部署,最终采纳多线程的形式加载模型并行预测,实现了高效部署,最终在v100服务器达到了22fps,满足端侧移植的条件

图9 推理流程阐明

部署方面应用飞桨原生推理库PaddleLite进行部署,满足用户批量预测、数据安全性高、提早低的需要,疾速在本地实现部署计划,以后部署计划曾经公布,欢送小伙伴们应用尝试。

图10 安卓app示范

产业实际范例教程

助力企业逾越AI落地鸿沟

飞桨产业实际范例,致力于减速AI在产业落地的后退门路,缩小实践技术与产业利用的差距。范例来源于产业实在业务场景,通过残缺的代码实现,提供从数据筹备到模型部署的计划过程解析,堪称产业落地的“主动导航”。

  • 实在产业场景: 与理论具备AI利用的企业单干共建,选取企业高频需要的AI利用场景如智慧城市-安全帽检测、智能制作-表计读数等;
  • 残缺代码实现: 提供可一键运行的代码,在“AIStudio一站式开发平台”上应用收费算力一键Notebook运行;
  • 具体过程解析: 深度解析从数据筹备和解决、模型抉择、模型优化和部署的AI落地全流程,共享可复用的模型调参和优化教训;
  • 中转我的项目落地: 百度高工手把手教用户进行全流程代码实际,轻松中转我的项目POC阶段。

精彩课程预报

为了让小伙伴们更便捷地实际和利用驾驶环境感知,百度飞桨产品经理将于3月17日20:30-21:00为大家深度解析从数据筹备、方案设计到模型优化部署的开发全流程,手把手教大家进行代码实际。

欢送小伙伴们扫码进群,收费获取直播课和回放视频链接,更有机会取得笼罩智慧城市、工业制作、金融、互联网等行业的飞桨产业实际范例手册! 也欢送感兴趣的企业和开发者与咱们分割,交换技术探讨单干。

点击立刻报名


推荐阅读
  • Sapphire 测试网上线:首个支持 EVM 的隐私 ParaTime 环境
    Sapphire 测试网上线:首个支持 EVM 的隐私 ParaTime 环境 ... [详细]
  • 进程(Process)是指计算机中程序对特定数据集的一次运行活动,是系统资源分配与调度的核心单元,构成了操作系统架构的基础。在早期以进程为中心的计算机体系结构中,进程被视为程序的执行实例,其状态和控制信息通过任务描述符(task_struct)进行管理和维护。本文将深入探讨进程的概念及其关键数据结构task_struct,解析其在操作系统中的作用和实现机制。 ... [详细]
  • 步入人工智能新时代,掌握这些关键知识点至关重要。AI技术将成为人类的重要辅助工具,不仅能够扩展和增强人类的智能,还能帮助我们实现更加卓越的成就。新一代人工智能技术的发展将为各行各业带来深远的影响,推动社会进步与创新。 ... [详细]
  • 8月16日,由容联主办,清华大学五道口金融学院和阿里达摩院共同支持的“科技助力金融50人论坛”在深圳成功举办。此次论坛作为通讯云中国行系列活动的重要组成部分,汇聚了行业精英,深入探讨了金融科技的最新趋势和发展机遇,旨在推动金融行业的创新与变革,开启金融未来的新篇章。容联创始人兼CEO在会上发表了重要演讲,分享了公司在金融科技领域的最新成果和未来展望。 ... [详细]
  • 2018年热门趋势:轻松几步构建高效智能聊天机器人
    2018年,构建高效智能聊天机器人的简易步骤成为行业焦点。作为AI领域的关键应用,聊天机器人不仅被视为企业市场智能化转型的重要工具,也是技术变现的主要途径之一。随着自然语言处理技术的不断进步,越来越多的企业开始重视并投资于这一领域,以期通过聊天机器人提升客户服务体验和运营效率。 ... [详细]
  • 面部识别技术面临关键转折点:伦理与应用的平衡挑战
    面部识别技术正面临一个关键的转折点,其伦理与应用之间的平衡问题日益凸显。近日,该技术再次遭遇重大事件。本周二,由90个倡议组织组成的联盟发布了一份联合声明,呼吁全球范围内暂停使用面部识别技术,直到制定出明确的监管框架。这一举措反映了社会各界对隐私保护和技术滥用的担忧,同时也引发了关于如何在保障公共安全和维护个人隐私之间找到合理平衡的广泛讨论。 ... [详细]
  • 从无到有,构建个人专属的操作系统解决方案
    操作系统(OS)被誉为程序员的三大浪漫之一,常被比喻为计算机的灵魂、大脑、内核和基石,其重要性不言而喻。本文将详细介绍如何从零开始构建个人专属的操作系统解决方案,涵盖从需求分析到系统设计、开发与测试的全过程,帮助读者深入理解操作系统的本质与实现方法。 ... [详细]
  • 全面解析Java虚拟机:内存模型深度剖析 ... [详细]
  • 2019年后蚂蚁集团与拼多多面试经验详述与深度剖析
    2019年后蚂蚁集团与拼多多面试经验详述与深度剖析 ... [详细]
  • 探究WiFi项目部署对运营商转型挑战的影响与解决方案
    长期以来,运营商的转型问题一直是业界关注的焦点。随着传统商业模式的增长乏力,外部环境的变化加剧了行业的下行压力。为了应对这些挑战,本文深入探讨了WiFi项目部署对运营商转型的影响,并提出了切实可行的解决方案,旨在帮助运营商在新的市场环境中实现可持续发展。 ... [详细]
  • 本文深入对比了Unity HTML5与Unity 5.0在技术特性、应用场景及开发难度等方面的不同。分析指出,尽管两者均需一定的编程基础,但HTML5作为前端开发语言,对开发者的技术要求相对更高,尤其是在英语文档阅读和理解方面。相比之下,Unity 5.0更加侧重于游戏和交互式内容的视觉表现,更适合具备美术背景的开发者使用。此外,文章还探讨了两者在不同平台上的适应性和未来发展趋势。 ... [详细]
  • 视觉图像的生成机制与英文术语解析
    近期,Google Brain、牛津大学和清华大学等多家研究机构相继发布了关于多层感知机(MLP)在视觉图像分类中的应用成果。这些研究深入探讨了MLP在视觉任务中的工作机制,并解析了相关技术术语,为理解视觉图像生成提供了新的视角和方法。 ... [详细]
  • MVVM架构~mvc,mvp,mvvm大话开篇
    返回目录百度百科的定义:MVP是从经典的模式MVC演变而来,它们的基本思想有相通的地方:ControllerPresenter负责逻辑的处理,Model提供数据,View负责显示。作为一种新的模 ... [详细]
  • Go语言中Goroutine与通道机制及其异常处理深入解析
    在Go语言中,Goroutine可视为一种轻量级的并发执行单元,其资源消耗远低于传统线程,初始栈大小仅为2KB,而普通线程则通常需要几MB。此外,Goroutine的调度由Go运行时自动管理,能够高效地支持成千上万个并发任务。本文深入探讨了Goroutine的工作原理及其与通道(channel)的配合使用,特别是在异常处理方面的最佳实践,为开发者提供了一套完整的解决方案,以确保程序的稳定性和可靠性。 ... [详细]
  • 不用蘑菇,不拾金币,我通过强化学习成功通关29关马里奥,创造全新纪录
    《超级马里奥兄弟》由任天堂于1985年首次发布,是一款经典的横版过关游戏,至今已在多个平台上售出超过5亿套。该游戏不仅勾起了许多玩家的童年回忆,也成为强化学习领域的热门研究对象。近日,通过先进的强化学习技术,研究人员成功让AI通关了29关,创造了新的纪录。这一成就不仅展示了强化学习在游戏领域的潜力,也为未来的人工智能应用提供了宝贵的经验。 ... [详细]
author-avatar
仰望天空说再见
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有