热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

目前最先进的目标检测能用于自动驾驶吗?这群德国人认真地做了个测评!

点击我爱计算机视觉标星,更快获取CVML新技术目标检测是自动驾驶技术的重要内容,确保上路安全,需要能够精准地检测出路面上所有目标。这不仅要求汽车感知系统在正常的外界环境工作正常,对

点击我爱计算机视觉标星,更快获取CVML新技术


目标检测是自动驾驶技术的重要内容,确保上路安全,需要能够精准地检测出路面上所有目标。

这不仅要求汽车感知系统在正常的外界环境工作正常,对于极端恶劣的天气,比如下雪天,也能运行正常。

下图是在自动驾驶系统中,环境变化带来的挑战,雨、雪、雾,还有火灾现场。

目前最先进的目标检测能用于自动驾驶吗?这群德国人认真地做了个测评!

随着技术的进步,大量目标检测技术被提出,不断涌出的标着state-of-the-art标签的最先进的算法能够抵御复杂的路况吗?

今天arXiv新出的论文Benchmarking Robustness in Object Detection: Autonomous Driving when Winter is Coming,来自德国图宾根大学和马普所的研究人员,模拟了多个不同环境、成像状况等图像被污损的场景,测评了目前最先进的目标检测算法。

以下是作者信息:

目前最先进的目标检测能用于自动驾驶吗?这群德国人认真地做了个测评!

结果不出所料,图像被污损后,所有算法的检测精度都大幅下降。

下图是一个例子:

目前最先进的目标检测能用于自动驾驶吗?这群德国人认真地做了个测评!

使用Faster R-CNN算法,上图中左子图把一条龙检测为鸟(现实中不会出现龙。。。作者只是举个例子),更糟糕的是,当图像被“下雪”后,竟然两个目标都检测不出了。

这就有点过分了,因为“下雪”后,人眼可是能轻而易举看出画面中的目标的。

鲁棒目标检测基准测试

作者们提出新的目标检测基准测试Robust Detection Benchmark,在现有数据集基础上,制作了三个大型图像被污损后的目标检测数据集:Pascal-C, Coco-C , Cityscapes-C。

下图为作者在前人启发下模拟的 15 种图像被污损的情形,这15种情况可以分为 noise, blur, digital, weather 4 组,而每一种情况,都模拟出了5个不同的严重等级(由轻微到严重)。

目前最先进的目标检测能用于自动驾驶吗?这群德国人认真地做了个测评!

算法评测

作者评估了多个目标检测算法:

Faster R-CNN [Ren et al., 2015], 

Mask R-CNN [He et al.,2017], 

Cascade R-CNN [Cai and Vasconcelos, 2018], 

Cascade Mask R-CNN [Chen et al., 2019a], 

RetinaNet [Lin et al., 2017a],

Hybrid Task Cascade [Chen et al., 2019a]。

其中有2个算法,是上个月才被提出的state-of-the-art,可谓代表目标检测领域的顶尖水平。

文中使用的评价指标不再赘述,我们来看看结果吧。

下图中clean代码原始数据集,corrupted为被污损后的数据集,relative代表精度下降的幅度。

目前最先进的目标检测能用于自动驾驶吗?这群德国人认真地做了个测评!

可见,最少下降31.1%,最大下降64.7%!

下图为使用Faster RCNN算法随着污损严重程度变化检测结果实验的折线图,可见精度是一致性的下降。

目前最先进的目标检测能用于自动驾驶吗?这群德国人认真地做了个测评!

然后作者使用Faster RCNN在不同骨干网下进行了实验,发现容量更大的骨干网表现出一致性的精度更好。如下图:

目前最先进的目标检测能用于自动驾驶吗?这群德国人认真地做了个测评!

神奇的风格迁移

如何提高模型抗图像污损的鲁棒性?

作者实验了使用图像风格化来增广训练数据,使用的风格化方法来自:AdaIN [Huang and Belongie, 2017](已开源)。

风格化图像示例:

目前最先进的目标检测能用于自动驾驶吗?这群德国人认真地做了个测评!

是不是看起来跟现实环境差别很大,不过没关系,我们要的是疗效!

如下表格:

目前最先进的目标检测能用于自动驾驶吗?这群德国人认真地做了个测评!

图中combined一行即为将原始数据和风格化后数据放在一起训练的结果。使用Faster RCNN实验。

虽然在污损鲁棒性实验中没能达到原始图像的指标,但风格化后图像加入训练集的检测结果却大大提高了

这对你有什么启发么?原来图像增广不能完全按照人眼看起来OK为标准,而且风格化还真有效!

开源代码

作者希望该研究能够引起更多人重视,已经开源了代码,欢迎大家提交新的图像污损方法,做更贴近真实场景的测评。

基准测试代码和数据:

https://github.com/bethgelab/robust-detection-benchmark

图像污损代码(感觉很有用,不止用于该任务):

https://github.com/bethgelab/imagecorruptions

文中用到的图像风格化算法代码:

https://github.com/bethgelab/stylize-datasets

作者基于mmdetection进行算法测试的代码:

https://github.com/bethgelab/mmdetection

论文链接:

https://arxiv.org/pdf/1907.07484v1.pdf

(在公众号对话界面回复“检测鲁棒性”,即可收到论文)

本文为CV君对论文的原创解读,目前只有不到7%的公众号还在努力原创,希望你文末点个“在看”鼓励我。


CV细分方向交流群

52CV已经建立多个CV专业交流群,包括:目标跟踪、目标检测、语义分割、姿态估计、人脸识别检测、医学影像处理、超分辨率、神经架构搜索、GAN、强化学习等,扫码添加CV君拉你入群,

请务必注明相关方向,比如:目标检测

目前最先进的目标检测能用于自动驾驶吗?这群德国人认真地做了个测评!

喜欢在QQ交流的童鞋,可以加52CV官方QQ群805388940

(不会时时在线,如果没能及时通过验证还请见谅)


目前最先进的目标检测能用于自动驾驶吗?这群德国人认真地做了个测评!

长按关注我爱计算机视觉


推荐阅读
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • AstridDAO 专访:波卡稳定币黑马 BAI
    加入Pol ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
  • 人脸检测 pyqt+opencv+dlib
    一、实验目标绘制PyQT界面,调用摄像头显示人脸信息。在界面中,用户通过点击不同的按键可以实现多种功能:打开和关闭摄像头, ... [详细]
  • 今天凌晨开始苹果正式开始了iOS10的推送工作,使用iPhone和iPad的用户可 ... [详细]
  • 关于我们EMQ是一家全球领先的开源物联网基础设施软件供应商,服务新产业周期的IoT&5G、边缘计算与云计算市场,交付全球领先的开源物联网消息服务器和流处理数据 ... [详细]
  • 如何在服务器主机上实现文件共享的方法和工具
    本文介绍了在服务器主机上实现文件共享的方法和工具,包括Linux主机和Windows主机的文件传输方式,Web运维和FTP/SFTP客户端运维两种方式,以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外,还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK,以及主机迁移服务会收集的源端服务器信息。 ... [详细]
  • FeatureRequestIsyourfeaturerequestrelatedtoaproblem?Please ... [详细]
  • 本文介绍了Java集合库的使用方法,包括如何方便地重复使用集合以及下溯造型的应用。通过使用集合库,可以方便地取用各种集合,并将其插入到自己的程序中。为了使集合能够重复使用,Java提供了一种通用类型,即Object类型。通过添加指向集合的对象句柄,可以实现对集合的重复使用。然而,由于集合只能容纳Object类型,当向集合中添加对象句柄时,会丢失其身份或标识信息。为了恢复其本来面貌,可以使用下溯造型。本文还介绍了Java 1.2集合库的特点和优势。 ... [详细]
  • 在IDEA中运行CAS服务器的配置方法
    本文介绍了在IDEA中运行CAS服务器的配置方法,包括下载CAS模板Overlay Template、解压并添加项目、配置tomcat、运行CAS服务器等步骤。通过本文的指导,读者可以轻松在IDEA中进行CAS服务器的运行和配置。 ... [详细]
  • 学习笔记17:Opencv处理调整图片亮度和对比度
    一、理论基础在数学中我们学过线性理论,在图像亮度和对比度调节中同样适用,看下面这个公式:在图像像素中其中:参数f(x)表示源图像像素。参数g(x)表示输出图像像素。 ... [详细]
  • 篇首语:本文由编程笔记#小编为大家整理,主要介绍了VoLTE端到端业务详解|VoLTE用户注册流程相关的知识,希望对你有一定的参考价值。书籍来源:艾怀丽 ... [详细]
  • 科技感英文字体_软件用的很6,理论也掌握了,就差搞懂字体了?
    字体是视觉设计中最重要的传达元素之一,字体本身的视觉特性和品质影响着信息传递的质量,英文字体有自己非常完善的系统,如果要精通则需要从字体的 ... [详细]
  • 腾讯、阿里的城市大脑较量
    配图来自Canva2016年的一天,在江苏省无锡市的鸿山小镇,正在悄然进行着一场物联网、云计算等新兴科技应用的宏大计划,这就是国内智慧城市的第一个试点。4年后的今天,鸿山小镇已经 ... [详细]
  • 集成度|窄带_信而泰OLT使用介绍网络测试仪实操
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了信而泰OLT使用介绍-网络测试仪实操相关的知识,希望对你有一定的参考价值。 ... [详细]
author-avatar
happy柒月卍520
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有