当前位置: 开发笔记 > 后端 > 正文

车辆追踪算法大PK：SVM+HOGvs.YOLO

作者：_嗚啦啦900 | 来源：互联网 | 2023-07-12 11:54

介绍对于Udacity（优达学城）自动驾驶汽车纳米学位的汽车检测和跟踪项目，如果使用传统的计算机可视化技术将是一个挑战，就像方向梯度直方图（HistogramofOrientedG

介绍

对于Udacity（优达学城）自动驾驶汽车纳米学位的汽车检测和跟踪项目，如果使用传统的计算机可视化技术将是一个挑战，就像方向梯度直方图（Histogram of Oriented Gradients，HOG）和其它特征组合在一起在视频里跟踪汽车一样，理想的解决方案应该是实时运行的，如>30FPS，我曾经使用线性SVM来处理视频，在一台i7 CPU计算机上得到的结果只有可怜的3FPS。最后我使用YOLO来处理视频终于通过了Udacity的项目，YOLO是一个超快的用于对象检测的卷积神经网络，如果你的GPU够快（我当时使用的是GTX 1080），视频处理的速度可以达到65FPS，比我用SVM+HOG的方法足足快20倍。

数据集

我使用了KITTI和GTI数据集，以及来自项目训练仓库的一些其它数据，只有两类数据：有车的和没有车的，GTI数据从视频流获得，因此所有图像都完全是随机的，然后被分为训练和测试数据集，在训练和测试数据集之间建立相关关系，我将每个数据源30%的数据集作为验证和测试数据集，所有图像都被重置为64x64像素的大小，以便于特征的提取。

特征提取

我使用的特征向量如下：

空间特征：除了用于自检的像斑（16x16像素）外啥都没有。

颜色直方图特征：捕获每个像斑的统计颜色信息，通过这种特征向量捕获的汽车颜色通常是非常饱和的。

方向梯度直方图（HOG）特征：捕获每个图像通道的梯度结构，在不同的光线条件下，这种方法表现得还不错。

在这篇博客里有关于HOG特征的详细描述，其思想始终是，在一个直方图里，在一个图像上聚集梯度，让特征向量在不同视角和光线条件下变得更加稳定。下面是HOG特征应用于有车的和没车的图像上时的可视化呈现。

最后一个特征向量包含前面3个不同方法提取的特征，因此有必要对每一个特征进行计量，防止因取值范围不同导致某一特征占主导地位，我使用了scikit学习包中的Standard.Scaler函数，通过移动平均值和按比例缩放到单位方差来标准化特征。

训练一个线性支持向量机

和其它分类和检测问题不同，检测汽车需要强实时，因此，要在高准确性和速度之间取得平衡，影响性能最主要的两个参数是特征向量的长度和汽车检测算法，线性SVM在速度和准确性之间提供了最好的折中方案，比随机森林（快但准确性不够）和非线性SVM（rbf内核，非常慢）的表现要好得多。最后测试时使用了一个包含6156个特征的特征向量，准确性超过了98.5%，但仍然有将近1.5%的像斑时不时的晃眼，特别是车道线、事故故障和栏杆。

滑动窗口

通常情况下，汽车检测和摄像机使用滑动窗口扫描图像一帧一帧记录类似，对每个窗口而言，通过计算特征向量并输入到分类器中，汽车在不同距离出现时，有必要搜索多个尺度，通常会有100多个特征向量需要提取，然后输入到分类器中，对每一帧图像进行处理。下面是正面检测大约150个窗口的例子，不出意外，仍然会有一些失误。

为了过滤掉误判结果，我一直跟着检测窗口直到最后30帧，只考虑被准确识别的图像，最后有超过15次检测被记录下来，我用热图来呈现最终结果，可以看到噪点大大减少，

通过热图的阈值，包含所有非零值的热图最小矩形边界框就可以确定下来。

全文点击：http://click.aliyun.com/m/12645/

推荐阅读

ci
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
cache
大数据时代的机器学习：人工特征工程与线性模型的局限

本文探讨了在大数据背景下，人工特征工程与线性模型的应用及其局限性。随着数据量的激增和技术的进步，传统的特征工程方法面临挑战，文章提出了未来发展的可能方向。 ... [详细]

蜡笔小新 2024-12-07 11:58:58
ci
《计算机视觉：算法与应用》第二版初稿上线，全面更新迎接未来

经典计算机视觉教材《计算机视觉：算法与应用》迎来了其第二版，现已开放初稿下载。本书由Facebook研究科学家Richard Szeliski撰写，自2010年首版以来，一直是该领域的标准参考书。 ... [详细]

蜡笔小新 2024-11-30 20:56:47
ci
语义、实例与全景分割的对比分析（Comparative Analysis of Semantic, Instance, and Panoptic Segmentation）

图像分割技术在人工智能领域中扮演着关键角色，其中语义分割、实例分割和全景分割是三种主要的方法。本文对这三种分割技术进行了详细的对比分析，探讨了它们在不同应用场景中的优缺点和适用范围，为研究人员和从业者提供了有价值的参考。 ... [详细]

蜡笔小新 2024-10-29 18:51:14
正则
机器学习中的相似度度量与模型优化

本文探讨了机器学习中常见的相似度度量方法，包括余弦相似度、欧氏距离和马氏距离，并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外，文章还涵盖了模型评估的各种方法和指标，以及不同分类器的工作原理和应用场景。 ... [详细]

蜡笔小新 2024-12-26 18:10:02
正则
机器学习核心概念与技术

本文系统梳理了机器学习的关键知识点，涵盖模型评估、正则化、线性模型、支持向量机、决策树及集成学习等内容，并深入探讨了各算法的原理和应用场景。 ... [详细]

蜡笔小新 2024-12-22 09:15:30
正则
吴石访谈：腾讯安全科恩实验室如何引领物联网安全研究

腾讯安全科恩实验室曾两次成功破解特斯拉自动驾驶系统，并远程控制汽车，展示了其在汽车安全领域的强大实力。近日，该实验室负责人吴石接受了InfoQ的专访，详细介绍了团队未来的重点方向——物联网安全。 ... [详细]

蜡笔小新 2024-11-22 13:27:32
python
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
正则
弱监督目标检测之一最小熵隐变量模型

目标检测是计算机视觉一个非常重要的子任务。目标检测需要发现并准确定位自然图片中的物体。在2012年之前，目标检测主要基于手工设计的特征以及传统分类器。2012年以后，出现了 ... [详细]

蜡笔小新 2024-10-20 17:50:44
python
AI炼金术：KNN分类器的构建与应用

本文介绍了如何使用Python及其相关库（如NumPy、scikit-learn和matplotlib）构建KNN分类器模型。通过详细的数据准备、模型训练及新样本预测的过程，展示KNN算法的实际操作步骤。 ... [详细]

蜡笔小新 2024-11-21 11:40:55
python
机器学习算法：SVM（支持向量机）

SVM算法（SupportVectorMachine，支持向量机）的核心思想有2点：1、如果数据线性可分，那么基于最大间隔的方式来确定超平面，以确保全局最优， ... [详细]

蜡笔小新 2024-11-14 04:33:58
python
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
ci
数据分析(4)sklearn入门

如何选择机器学习方法http:scikit-learn.orgstabletutorialmachine_learning_mapindex.html通用学习模式只需要先定义 ... [详细]

蜡笔小新 2024-10-21 03:54:07
正则
深度学习: 目标函数

Introduction目标函数是深度学习之心，是模型训练的发动机。目标函数(objectfunction)损失函数(lossfunction)代价函数(costfunction) ... [详细]

蜡笔小新 2024-10-18 18:45:28
python
vmware workstation14嵌套安装kvm

vmware workstation14嵌套安装kvm ... [详细]

蜡笔小新 2024-10-17 16:30:10

_嗚啦啦900

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章