无人驾驶技术课——感知（2）

作者：雨天是最美 | 来源：互联网 | 2023-10-11 08:26

在感知部分的课程中，我们将首先介绍计算机视觉的基本应用领域；再进一步了解机器学习、神经网络和卷积神经网络的基础知识；随后我们将讨论感知模块

在感知部分的课程中&＃xff0c;我们将首先介绍计算机视觉的基本应用领域&＃xff1b;再进一步了解机器学习、神经网络和卷积神经网络的基础知识&＃xff1b;随后我们将讨论感知模块在无人车中的具体任务&＃xff1b;最后了解 Apollo 感知模块的体系结构和传感器融合的相关内容。

上节课&＃xff0c;我们学习了计算机视觉的基本应用领域&＃xff0c;这节课我们将重点了解机器学习、神经网络和卷积神经网络的基础知识。

机器学习

机器学习是使用特殊算法来训练计算机并从数据中学习的计算机科学领域。通常情况下&＃xff0c;这种学习结果存放在一种被称为“模型”的数据结构中。事实上&＃xff0c;“模型”只是一种可用于理解和预测世界的数据结构。

机器学习诞生于20世纪60年代&＃xff0c;但随着计算机硬件的不断改进&＃xff0c;在过去的20年中才越来越受欢迎。例如&＃xff0c;金融公司现在正通过机器学习来对汇率和证券交易进行预测&＃xff0c;零售企业使用机器学习来预测需求&＃xff0c;医生甚至使用机器学习来辅助医疗诊断。

机器学习应用&＃xff1a;金融公司、零售企业、医生

机器学习涉及使用数据和相关的真值标记来进行模型训练。例如&＃xff0c;可能会显示车辆和行人的计算机图像&＃xff0c;以及告诉计算机图像的对应标签&＃xff0c;我们会让计算机学习如何更好地区分两类图像&＃xff0c;这类机器学习也被称为监督式学习&＃xff0c;因为模型利用了人类创造的真值标记。

监督式学习

设想一个类似的学习过程&＃xff0c;但该过程使用了没有真值标记的车辆与行人图像。在这种方法中&＃xff0c;我们会让计算机自行决定哪些图像相似、哪些图像不同&＃xff0c;这被称为无监督学习。

无监督学习

这里我们不提供真值标记&＃xff0c;而是通过分析输入的数据&＃xff08;在这种情况下为摄像头图像&＃xff09;&＃xff0c;计算机凭借自行学习找到区别。

另一种方法被称为“半监督式”学习&＃xff0c;它将监督学习和无监督学习的特点结合在一起&＃xff0c;该方法使用少量的标记数据和大量的未标记数据来训练模型。

强化学习是另一种机器学习。强化学习涉及允许模型通过尝试许多不同的方法来解决问题&＃xff0c;然后衡量哪种方法最为成功&＃xff0c;计算机将尝试许多不同的解决方案&＃xff0c;最终使其方法与环境相适应。

例如&＃xff0c;在模拟器中强化学习智能体可训练汽车进行右转&＃xff0c;智能体将在初始位置发动车辆&＃xff0c;然后进行实验性驾驶&＃xff0c;以多种不同的方向和行驶速度&＃xff0c;如果汽车实际完成了右转&＃xff0c;智能体会提高奖励&＃xff08;即得分&＃xff09;&＃xff0c;这是针对导致成功结果的初始操作。

起初&＃xff0c;汽车可能无法找到执行转弯的方法&＃xff0c;然而就像人类那样汽车最终会从一些成功的右转经验中学习&＃xff0c;最后学会如何完成任务。

神经网络

人工神经网络用于无人驾驶车受到构成人类神经系统的生物神经元启发&＃xff0c;生物神经元通过相互连接&＃xff0c;构成了神经元网络或神经网络&＃xff0c;通过类似的方式我们可以将人工神经元层连接起来以创建用于机器学习的人工神经网络。

人工神经网络是通过数据来学习复杂模式的工具。神经网络由大量的神经元组成&＃xff0c;正如人体神经系统的神经元那样&＃xff0c;人工神经元负责传递和处理信息&＃xff0c;也可以对这些神经元进行训练&＃xff0c;你可以将这些图像识别为车辆&＃xff0c;无论它们是黑是白&＃xff0c;或大或小&＃xff0c;你甚至可能不知道自己如何知道它们是车辆&＃xff0c;也许是某些特征触发了你的反应&＃xff0c;如车轮、车灯和车窗。

人工神经网络具有相似的运作方式&＃xff0c;通过密集训练&＃xff0c;计算机可以辨别汽车、行人、交通信号灯和电线杆。

我们不是总能理解计算机如何做出这样的辨别&＃xff0c;但它们学习了用于执行任务的模型&＃xff0c;只是我们可能很直观地理解该数学模型。当看到该图像时&＃xff0c;你的大脑如何工作&＃xff1f;大脑可能会将图像分为几部分&＃xff0c;然后识别特征&＃xff0c;如车轮、车窗和颜色&＃xff0c;然后大脑将使用这些特征对图像进行检测和分类。

例如&＃xff0c;在确定图像是否为汽车时&＃xff0c;大脑可能不会认为颜色是关键特征&＃xff0c;因为汽车有多种颜色&＃xff0c;所以大脑会将更多权重放在其他特征上&＃xff0c;并降低颜色的重要性。

同样的&＃xff0c;神经网络也会从图像中提取许多特征&＃xff0c;但这些特征可能是我们人类无法描述或甚至无法理解的特征。

但我们最终不需要理解&＃xff0c;计算机将调整这些特征的权重以完成神经网络的最终任务&＃xff0c;这就是深层神经网络的思维方式。

反向传播算法

前面我们已经讨论过神经网络如何从数据中“学习”&＃xff0c;那么你可能想知道这种学习如何发生。学习有时称为训练&＃xff0c;它由三部循环组成&＃xff1a;前馈、误差测定和反向传播。

首先随机分配初始权重&＃xff0c;即人工神经元的值&＃xff0c;通过神经网络来馈送每个图像&＃xff0c;产生输出值&＃xff0c;这被称为前馈。

下一步为误差测定。误差是真值标记与前馈过程所产生输出之间的偏差。

最后一步是反向传播&＃xff0c;通过神经网络反向发送误差&＃xff0c;此过程类似前馈过程&＃xff0c;只是以相反方向进行。每个人工神经元都对其值进行微调&＃xff0c;这是基于通过神经网络后向传播的误差。

所有这些独立调整的结果&＃xff0c;可生成更准确的网络。

一个训练周期包括前馈、误差测定和反向传播还远远不够。为了训练网络&＃xff0c;通常需要数千个这样的周期&＃xff0c;但最终结果应该是模型能够通过新数据做出准确预测。

卷积神经网络

卷积神经网络&＃xff08;CNN&＃xff09;是一种人工神经网络&＃xff0c;它对感知问题特别有效。CNN 接受多维输入&＃xff0c;包括定义大多数传感器数据的二维和三维形状。如果使用标准神经网络对图像进行分类&＃xff0c;则需要通过一种方法将图像连接到网络的第一层&＃xff0c;这属于一维。标准做法是通过将图像矩阵重塑为一个矢量&＃xff0c;并在一个大行中连接所有列&＃xff0c;将图像“展开”为一维的像素阵列。

然而&＃xff0c;这种方法打破了图像中所嵌入的空间信息。如果图像中有车轮&＃xff0c;则车轮中的所有像素将散布在整个像素阵列中。这些像素以二维码方式连接形成车轮&＃xff0c;如果我们将其散布在一个维度上&＃xff0c;神经网络很难从图像中提取车轮。

CNN 通过维持输入像素之间的空间关系来解决这个问题。具体来说&＃xff0c;CNN 通过将过滤器连续滑过图像来收集信息&＃xff0c;每次收集信息时&＃xff0c;只对图像的一小部分区域进行分析&＃xff0c;这个过程被称为“卷积”。当我们在整个输入图像上对一个过滤器进行“卷积”时&＃xff0c;我们将该信息与下一个卷积层相关联。

例如&＃xff0c;CNN 可以识别第一个卷积层中的基本边缘和颜色信息&＃xff0c;然后通过在第一层上卷积新过滤器&＃xff0c;CNN 可以使用边缘和颜色信息来归纳更复杂的结构&＃xff0c;如车轮、车门和挡风玻璃&＃xff1b;而另一个卷积可使用车轮、车门和挡风玻璃识别整个车辆&＃xff1b;最后&＃xff0c;神经网络可使用这一高阶信息对车辆进行分类。

人们通常不太清楚 CNN 如何解读图像&＃xff0c;CNN 有时会侧重于图像中令人惊讶的部分&＃xff0c;但这也是深度学习的神奇之处&＃xff0c;CNN 根据其任务查找真正需要的特征&＃xff0c;任务可能是图像检测、分类、分割或其他类型的目标。

掌握了以上有关于机器学习、神经网络、反向传播算法以及卷积神经网络的基础知识&＃xff0c;大家有什么学习心得呢&＃xff1f;欢迎在下方留言区热烈讨论~

下节课我们将深入了解感知模块在无人车中的具体任务。

【转自Apollo阿波罗智能驾驶】

【推荐阅读】

无人驾驶技术课——感知&＃xff08;1&＃xff09;

添加极客助手微信&＃xff0c;加入技术交流群

长按&＃xff0c;扫码&＃xff0c;关注公众号

推荐阅读

微信
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
微信
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
微信
每日一书丨AI圣经《深度学习》作者斩获2018年图灵奖

2019年3月27日——ACM宣布，深度学习之父YoshuaBengio,YannLeCun,以及GeoffreyHinton获得了2018年的图灵奖， ... [详细]

蜡笔小新 2024-09-27 16:03:32
微信
计算机视觉初学者指南：如何顺利入门

本文旨在为计算机视觉领域的初学者提供一套全面的入门指南，涵盖基础知识、技术工具、学习资源等方面，帮助读者快速掌握计算机视觉的核心概念和技术。 ... [详细]

蜡笔小新 2024-11-27 13:38:50
微信
深入浅出：Hadoop架构详解

Hadoop作为大数据处理的核心技术，包含了一系列组件如HDFS（分布式文件系统）、YARN（资源管理框架）和MapReduce（并行计算模型）。本文将通过实例解析Hadoop的工作原理及其优势。 ... [详细]

蜡笔小新 2024-11-26 13:26:40
微信
深度学习与神经网络课程总结

本文档总结了神经网络和深度学习课程中的关键概念和理论，包括机器学习的基本要素、算法类型以及数据特征表示等。 ... [详细]

蜡笔小新 2024-11-26 11:31:09
微信
探索CNN的可视化技术

神经网络的可视化在理论学习与实践应用中扮演着至关重要的角色。本文深入探讨了三种有效的CNN（卷积神经网络）可视化方法，旨在帮助读者更好地理解和优化模型。 ... [详细]

蜡笔小新 2024-11-24 11:30:28
微信
吴石访谈：腾讯安全科恩实验室如何引领物联网安全研究

腾讯安全科恩实验室曾两次成功破解特斯拉自动驾驶系统，并远程控制汽车，展示了其在汽车安全领域的强大实力。近日，该实验室负责人吴石接受了InfoQ的专访，详细介绍了团队未来的重点方向——物联网安全。 ... [详细]

蜡笔小新 2024-11-22 13:27:32
facebook
知识图谱与图神经网络在金融科技中的应用探讨

本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲，探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]

蜡笔小新 2024-11-21 15:02:52
百度
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
百度
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
百度
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
百度
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
百度
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
百度
表面缺陷检测数据集综述及GitHub开源项目推荐

本文综述了表面缺陷检测领域的数据集，并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理，为研究人员提供了全面的资源参考，有助于推动该领域的发展和技术进步。 ... [详细]

蜡笔小新 2024-10-29 08:22:46

雨天是最美

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章