热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

一种交通视频数据的车辆检测与分类模型

1.文章信息本次介绍的是题目为《Detectionandclassificationofvehiclesfortrafficvideoanalytics》的目标检测类文章2018年

1.文章信息

本次介绍的是题目为《Detection and classification of vehicles for traffic video analytics》的目标检测类文章

2018年发表在Procedia Computer Science上的一篇会议论文,会议为INNS Conference on Big Data and Deep Learning 2018

2.摘要

本文提出了一种基于CV技术的交通视频分析系统,该系统可以自动收集重要的统计数据,包括车辆计数、车辆类型分类、从视频中估计车辆速度和车道使用监控等。该系统的核心是交通视频中的车辆检测和分类。为此,本文对比了两个模型,一是MoG+SVM系统,二是基于Faster RCNN的模型。实验表明,Faster RCNN在检测静态、重叠或夜间条件下的车辆时优于MoG,并且在基于外观分类车辆类型的任务上也优于SVM

3.数据集

本文使用了两个数据集,分别为:

(1)印尼收费公路数据集(自有数据集)

通过相机从人行天桥上手动获取于两个著名印尼收费公路Jagorawi收费公路和Kapuk收费公路,数据为包括夜间视频的近一周数据。视频数据集的分辨率4096*2160,每秒22

(2)公共数据集MIT Traffic

麻省理工交通数据集是为交通场景分析拥挤场景的研究而设计的。包含一个90分钟长的交通视频序列,由一台固定的照相机记录下来。尺寸720*480,被分为20个片段

进入模型部分

图像中特定物体的检测是一个困难的问题,因为图像中物体的本质往往是不同大小、不同方向的物体,而且物体的重叠会检测结果为目标遮挡物。这些问题需要一种具有几个特性的检测算法,如平移不变性、旋转不变性和尺度不变性

4.模型一:基于MoG+SVM

模型一的思路是,先利用混合高斯背景减法(mixture of Gaussian background subtraction)来检测移动车辆在视频中的位置。从这些检测区域,我们形成图像的边界框,并使用经过训练的支持向量机(SVM)分类器对车辆类型进行分类,包括轿车、送货车(皮卡、带集装箱的车辆)、卡车、大型卡车和公共汽车

背景减法是用来检测在参考背景图像中不存在的图像新对象的方法。其基本原理是,一幅含有多个待检测目标的新图像被参考图像减去,生成一幅新图像,该图像对两幅图像的进行编码,并根据给定差异阈值判定是否为识别目标

背景相减检测车辆的图像处理步骤如下图

对于MoG检测方法,文章使用MoG来检测像素值的变化,减去背景图像,只留下前景对象。提取前景对象并使用一个边界框分割提取适当的图像来训练SVM模型让其基于图像分类,类别包括前面提到的五个汽车类一个额外的非汽车类。然后将图像调整为64x64的印度尼西亚收费公路数据集和32x32的麻省理工交通数据集。其中,麻省理工交通数据集由于车辆距离更远所以尺寸小。SVM的性能评价使用5折交叉验证,即80%的训练和20%的测试数据随机分割

此模型具体流程框图如下

5.模型二:基于Faster RCNN

模型二的思路是,训练RCNN(专门为检测和定位图像中的目标而设计的深度学习模型)来同时检测和分类交通场景视频帧中的车辆。通过这些交通场景中车辆的包围盒检测,我们可以对这些被检测车辆的位置进行短期跟踪,提取估计的速度车道位置等信息

从第一个数据集中交通场景的不同位置条件中抽取1058张图像进行标注。对第二个数据集抽样353张图像。基于这些图像,文章使用Faster RCNN进行训练,检测出相应的车辆类。同样使用5折交叉验证方案,即80%的训练和20%的测试数据随机分割

Faster RCNN框架结构如下图所示

Faster RCNN检测可能出现在视频某帧中的任何车辆的边界框类别。根据前边提到的六个类别和车辆边界框的位置对图像进行标注,并在这些图像上训练Faster RCNN,使Faster RCNN既可以对单个模型中的车辆进行检测,也可以对车型进行分类。如果边界框的检测值与标注框的交并比(并集上的交集)大于0.5,则视为边界框正确。而初始检测区域是由anchor box决定的,如下图

印尼数据中,文章使用尺寸为[64,128,256,512]和宽高比为[1:1,1:1.5,1.5:1]的anchor box对图片进行扫描,而对于MIT数据,文章使用尺寸为[32,64,128]和比例为[1:1,1:2,2:1]的anchor box对图片进行扫描寻找检测目标

6.追踪车辆及其行为的方法

文章使用OpenCV两种跟踪算法。对于印尼数据使用中值流跟踪算法,因为由于收费车道个人偏好的限制,大部分车辆会规则的直线移动,车辆尺寸变化不显著;对于MIT数据使用KCF跟踪算法,因为MIT数据集的车辆在十字路口展示了更多样化的运动,目标的尺度变化也更多样化

(1)估计车辆速度

针对印尼数据进行速度估计。连续跟踪30,使用相似三角形原理来完成跟踪任务。首先标定一个标准参照物,它不随时间的推移在录像中发生任何变化,记录此标定对象的实际宽度W米,距离摄像机的距离D米,再测量该标记对象在视频中出现时的宽度像素值P,于是可以计算相机的焦点F为

利用F,可以估计相机中其他物体的距离(单位米),为此需要知道被估计物体的宽度,假设正常车辆送货车宽度1.8米,公共汽车卡车的宽度为2.5米。还需要知道车辆在相机中的像素宽度,此值使用车辆检测包围框的宽度值。利用焦点公式,可以算出车辆与相机的估计距离

为了估计速度,计算在一个固定时间段内所涉及的车辆距离差。使用5帧的差值来估计车辆的速度,从而取五帧的平均速度来最小化不稳定的跟踪边界框对速度估计的影响。视频速率单位为帧/秒记为fps,则可估计车辆的速度

3.6这个系数是为了把速度单位从m/s换成km/h

(2)不同类型车辆的车道使用情况

手动定义每个场景的不同车道,车道的起点终点分别定义为p1p2,车辆包围框的中心点定义为p3,三个点都为二维坐标向量,则该车到每条指定车道的距离

就可据此判断车辆的车道使用

7.实验结果

模型一:使用两种不同的支持向量机对模型在两个数据集上进行测试,五折交叉验证准确率结果如下

模型二:使用Faster RCNN的模型五折交叉验证准确率结果如下

对于印度尼西亚收费公路数据集和麻省理工交通数据集,Faster RCNN在交叉验证精度方面优于这两个基于SVM的分类模型。另外,与麻省理工学院交通数据集的结果相比,印度尼西亚收费公路数据集的精度结果范围差异很大。文章认为这是由于印度尼西亚收费公路数据集存在较大的可变性,它不仅包括两个不同的地点,而且还包括光照条件的不同时间(白天和晚上)。而麻省理工学院的交通数据集只有一个场景有统一的照明条件(记录只进行了90分钟)

综上,本文介绍了一种交通视频自动分析系统。该系统能够自动统计车辆数量,对车辆进行分类,估计行驶车辆的速度,确定车道使用情况。下图为流量监控系统的接口实示例

8.创新点

(1)比较了混合高斯(MoG)背景减法+支持向量机(SVM)的车辆分类模型与Faster RCNN同时检测和分类车辆类别的性能。从本文实验中,发现了MoG + SVM系统的几个缺点,使其不适合在真实世界环境中的动态场景的交通视频分析。Faster RCNN方法作为基于外观的方法,在检测重叠车辆或在夜间低光条件下的车辆时优于MoGFaster RCNN的方法更适合交通视频分析的问题

(2)建立了一个系统,可以从车辆检测系统的结果估计其他重要信息的车辆,如估计速度车道使用

Attention

如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!


推荐阅读
  •     目标检测是计算机视觉一个非常重要的子任务。目标检测需要发现并准确定位自然图片中的物体。在2012年之前,目标检测主要基于手工设计的特征以及传统分类器。2012年以后,出现了 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • H5技术实现经典游戏《贪吃蛇》
    本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术,我们将探讨如何构建这款游戏的两种主要玩法:积分闯关和无尽模式。 ... [详细]
  • 分隔超平面:将数据集分割开来的直线叫做分隔超平面。超平面:如果数据集是N维的,那么就需要N-1维的某对象来对数据进行分割。该对象叫做超平面,也就是分类的决策边界。间隔:一个点 ... [详细]
  • cs231n Lecture 3 线性分类笔记(一)
    内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注:中文翻译 ... [详细]
  • 视觉Transformer综述
    本文综述了视觉Transformer在计算机视觉领域的应用,从原始Transformer出发,详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构,还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • 深度学习: 目标函数
    Introduction目标函数是深度学习之心,是模型训练的发动机。目标函数(objectfunction)损失函数(lossfunction)代价函数(costfunction) ... [详细]
  • vmware workstation14嵌套安装kvm
    vmware workstation14嵌套安装kvm ... [详细]
  • 圣诞节到了,智能菌想送你一份礼物
    关注网易智能,聚焦AI大事件,读懂下一个大时代!(机器学习算法地图见文末)圣诞节的赠书活动来了! ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 服务器虚拟化存储设计,完美规划储存与资源,部署高性能虚拟化桌面
    规划部署虚拟桌面环境前,必须先估算目前所使用实体桌面环境的工作负载与IOPS性能,并慎选储存设备。唯有谨慎估算贴近实际的IOPS性能,才能 ... [详细]
  • 本文探讨了Python类型注解使用率低下的原因,主要归结于历史背景和投资回报率(ROI)的考量。文章不仅分析了类型注解的实际效用,还回顾了Python类型注解的发展历程。 ... [详细]
  • 本文探讨了如何将个人经历,特别是非传统的职业路径,转化为职业生涯中的优势。通过作者的亲身经历,展示了舞蹈生涯对商业思维的影响。 ... [详细]
  • 二维码的实现与应用
    本文介绍了二维码的基本概念、分类及其优缺点,并详细描述了如何使用Java编程语言结合第三方库(如ZXing和qrcode.jar)来实现二维码的生成与解析。 ... [详细]
author-avatar
玩上加瘾_926
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有