当前位置: 开发笔记 > 编程语言 > 正文

天哪！用Python实现自动驾驶！

作者：镜水影快乐 | 来源：互联网 | 2023-08-14 09:01

文章来源：blog.csdn.netweixin_44169614?typeblog推荐阅读：终于来了，【第三期】彭涛Python爬虫特训

文章来源&＃xff1a;blog.csdn.net/weixin_44169614?type&＃61;blog

推荐阅读&＃xff1a;终于来了&＃xff0c;【第三期】彭涛Python 爬虫特训营&＃xff01;!

一、安装环境

gym是用于开发和比较强化学习算法的工具包&＃xff0c;在python中安装gym库和其中子场景都较为简便。

安装gym&＃xff1a;

pip install gym

安装自动驾驶模块&＃xff0c;这里使用Edouard Leurent发布在github上的包highway-env&＃xff08;链接&＃xff1a;https://github.com/eleurent/highway-env&＃xff09;&＃xff1a;

pip install --user git&＃43;https://github.com/eleurent/highway-env

其中包含6个场景&＃xff1a;

高速公路——“highway-v0”
汇入——“merge-v0”
环岛——“roundabout-v0”
泊车——“parking-v0”
十字路口——“intersection-v0”
赛车道——“racetrack-v0”

详细文档可以参考这里&＃xff1a;

https://highway-env.readthedocs.io/en/latest/

二、配置环境

安装好后即可在代码中进行实验&＃xff08;以高速公路场景为例&＃xff09;&＃xff1a;

import gym import highway_env %matplotlib inlineenv &＃61; gym.make(&＃39;highway-v0&＃39;) env.reset() for _ in range(3):action &＃61; env.action_type.actions_indexes["IDLE"]obs, reward, done, info &＃61; env.step(action)env.render()

运行后会在模拟器中生成如下场景&＃xff1a;

绿色为ego vehicle env类有很多参数可以配置&＃xff0c;具体可以参考原文档。

三、训练模型

1、数据处理

(1)state

highway-env包中没有定义传感器&＃xff0c;车辆所有的state (observations) 都从底层代码读取&＃xff0c;节省了许多前期的工作量。根据文档介绍&＃xff0c;state (ovservations) 有三种输出方式&＃xff1a;Kinematics&＃xff0c;Grayscale Image和Occupancy grid。

Kinematics

输出V*F的矩阵&＃xff0c;V代表需要观测的车辆数量&＃xff08;包括ego vehicle本身&＃xff09;&＃xff0c;F代表需要统计的特征数量。例&＃xff1a;

数据生成时会默认归一化&＃xff0c;取值范围&＃xff1a;[100, 100, 20, 20]&＃xff0c;也可以设置ego vehicle以外的车辆属性是地图的绝对坐标还是对ego vehicle的相对坐标。

在定义环境时需要对特征的参数进行设定&＃xff1a;

config &＃61; \{"observation": {"type": "Kinematics",#选取5辆车进行观察&＃xff08;包括ego vehicle&＃xff09;"vehicles_count": 5, #共7个特征"features": ["presence", "x", "y", "vx", "vy", "cos_h", "sin_h"], "features_range": {"x": [-100, 100],"y": [-100, 100],"vx": [-20, 20],"vy": [-20, 20]},"absolute": False,"order": "sorted"},"simulation_frequency": 8, # [Hz]"policy_frequency": 2, # [Hz]}

Grayscale Image

生成一张W*H的灰度图像&＃xff0c;W代表图像宽度&＃xff0c;H代表图像高度

Occupancy grid

生成一个WHF的三维矩阵&＃xff0c;用W*H的表格表示ego vehicle周围的车辆情况&＃xff0c;每个格子包含F个特征。

(2) action

highway-env包中的action分为连续和离散两种。连续型action可以直接定义throttle和steering angle的值&＃xff0c;离散型包含5个meta actions&＃xff1a;

ACTIONS_ALL &＃61; {0: &＃39;LANE_LEFT&＃39;,1: &＃39;IDLE&＃39;,2: &＃39;LANE_RIGHT&＃39;,3: &＃39;FASTER&＃39;,4: &＃39;SLOWER&＃39;}

(3) reward

highway-env包中除了泊车场景外都采用同一个reward function&＃xff1a;

这个function只能在其源码中更改&＃xff0c;在外层只能调整权重。&＃xff08;泊车场景的reward function原文档里有&＃xff0c;懒得打公式了……&＃xff09;

2、搭建模型

DQN网络的结构和搭建过程已经在我另一篇文章中讨论过&＃xff0c;所以这里不再详细解释。我采用第一种state表示方式——Kinematics进行示范。

由于state数据量较小&＃xff08;5辆车*7个特征&＃xff09;&＃xff0c;可以不考虑使用CNN&＃xff0c;直接把二维数据的size[5,7]转成[1,35]即可&＃xff0c;模型的输入就是35&＃xff0c;输出是离散action数量&＃xff0c;共5个。

import torch import torch.nn as nn from torch.autograd import Variable import torch.nn.functional as F import torch.optim as optim import torchvision.transforms as T from torch import FloatTensor, LongTensor, ByteTensor from collections import namedtuple import random Tensor &＃61; FloatTensorEPSILON &＃61; 0 # epsilon used for epsilon greedy approach GAMMA &＃61; 0.9 TARGET_NETWORK_REPLACE_FREQ &＃61; 40 # How frequently target netowrk updates MEMORY_CAPACITY &＃61; 100 BATCH_SIZE &＃61; 80 LR &＃61; 0.01 # learning rateclass DQNNet(nn.Module):def __init__(self):super(DQNNet,self).__init__() self.linear1 &＃61; nn.Linear(35,35)self.linear2 &＃61; nn.Linear(35,5) def forward(self,s):s&＃61;torch.FloatTensor(s) s &＃61; s.view(s.size(0),1,35) s &＃61; self.linear1(s)s &＃61; self.linear2(s)return s class DQN(object):def __init__(self):self.net,self.target_net &＃61; DQNNet(),DQNNet() self.learn_step_counter &＃61; 0 self.memory &＃61; []self.position &＃61; 0 self.capacity &＃61; MEMORY_CAPACITY self.optimizer &＃61; torch.optim.Adam(self.net.parameters(), lr&＃61;LR)self.loss_func &＃61; nn.MSELoss()def choose_action(self,s,e):x&＃61;np.expand_dims(s, axis&＃61;0)if np.random.uniform() < 1-e: actions_value &＃61; self.net.forward(x) action &＃61; torch.max(actions_value,-1)[1].data.numpy()action &＃61; action.max() else: action &＃61; np.random.randint(0, 5)return actiondef push_memory(self, s, a, r, s_):if len(self.memory) < self.capacity:self.memory.append(None)self.memory[self.position] &＃61; Transition(torch.unsqueeze(torch.FloatTensor(s), 0),torch.unsqueeze(torch.FloatTensor(s_), 0),\torch.from_numpy(np.array([a])),torch.from_numpy(np.array([r],dtype&＃61;&＃39;float32&＃39;)))#self.position &＃61; (self.position &＃43; 1) % self.capacitydef get_sample(self,batch_size):sample &＃61; random.sample(self.memory,batch_size)return sampledef learn(self):if self.learn_step_counter % TARGET_NETWORK_REPLACE_FREQ &＃61;&＃61; 0:self.target_net.load_state_dict(self.net.state_dict())self.learn_step_counter &＃43;&＃61; 1transitions &＃61; self.get_sample(BATCH_SIZE)batch &＃61; Transition(*zip(*transitions))b_s &＃61; Variable(torch.cat(batch.state))b_s_ &＃61; Variable(torch.cat(batch.next_state))b_a &＃61; Variable(torch.cat(batch.action))b_r &＃61; Variable(torch.cat(batch.reward)) q_eval &＃61; self.net.forward(b_s).squeeze(1).gather(1,b_a.unsqueeze(1).to(torch.int64)) q_next &＃61; self.target_net.forward(b_s_).detach() #q_target &＃61; b_r &＃43; GAMMA * q_next.squeeze(1).max(1)[0].view(BATCH_SIZE, 1).t() loss &＃61; self.loss_func(q_eval, q_target.t()) self.optimizer.zero_grad() # reset the gradient to zero loss.backward()self.optimizer.step() # execute back propagation for one step return loss Transition &＃61; namedtuple(&＃39;Transition&＃39;,(&＃39;state&＃39;, &＃39;next_state&＃39;,&＃39;action&＃39;, &＃39;reward&＃39;))

3、运行结果

各个部分都完成之后就可以组合在一起训练模型了&＃xff0c;流程和用CARLA差不多&＃xff0c;就不细说了。

初始化环境&＃xff08;DQN的类加进去就行了&＃xff09;&＃xff1a;

import gym import highway_env from matplotlib import pyplot as plt import numpy as np import time config &＃61; \{"observation": {"type": "Kinematics","vehicles_count": 5,"features": ["presence", "x", "y", "vx", "vy", "cos_h", "sin_h"],"features_range": {"x": [-100, 100],"y": [-100, 100],"vx": [-20, 20],"vy": [-20, 20]},"absolute": False,"order": "sorted"},"simulation_frequency": 8, # [Hz]"policy_frequency": 2, # [Hz]}env &＃61; gym.make("highway-v0") env.configure(config)

训练模型&＃xff1a;

dqn&＃61;DQN() count&＃61;0reward&＃61;[] avg_reward&＃61;0 all_reward&＃61;[]time_&＃61;[] all_time&＃61;[]collision_his&＃61;[] all_collision&＃61;[] while True:done &＃61; False start_time&＃61;time.time()s &＃61; env.reset()while not done:e &＃61; np.exp(-count/300) #随机选择action的概率&＃xff0c;随着训练次数增多逐渐降低a &＃61; dqn.choose_action(s,e)s_, r, done, info &＃61; env.step(a)env.render()dqn.push_memory(s, a, r, s_)if ((dqn.position !&＃61;0)&(dqn.position % 99&＃61;&＃61;0)):loss_&＃61;dqn.learn()count&＃43;&＃61;1print(&＃39;trained times:&＃39;,count)if (count%40&＃61;&＃61;0):avg_reward&＃61;np.mean(reward)avg_time&＃61;np.mean(time_)collision_rate&＃61;np.mean(collision_his)all_reward.append(avg_reward)all_time.append(avg_time)all_collision.append(collision_rate)plt.plot(all_reward)plt.show()plt.plot(all_time)plt.show()plt.plot(all_collision)plt.show()reward&＃61;[]time_&＃61;[]collision_his&＃61;[]s &＃61; s_reward.append(r) end_time&＃61;time.time()episode_time&＃61;end_time-start_timetime_.append(episode_time)is_collision&＃61;1 if info[&＃39;crashed&＃39;]&＃61;&＃61;True else 0collision_his.append(is_collision)

我在代码中添加了一些画图的函数&＃xff0c;在运行过程中就可以掌握一些关键的指标&＃xff0c;每训练40次统计一次平均值。

平均碰撞发生率&＃xff1a;

epoch平均时长(s)&＃xff1a;

平均reward&＃xff1a;

可以看出平均碰撞发生率会随训练次数增多逐渐降低&＃xff0c;每个epoch持续的时间会逐渐延长&＃xff08;如果发生碰撞epoch会立刻结束&＃xff09;

四、总结

相比于我在之前文章中使用过的模拟器CARLA&＃xff0c;highway-env环境包明显更加抽象化&＃xff0c;用类似游戏的表示方式&＃xff0c;使得算法可以在一个理想的虚拟环境中得到训练&＃xff0c;而不用考虑数据获取方式、传感器精度、运算时长等现实问题。对于端到端的算法设计和测试非常友好&＃xff0c;但从自动控制的角度来看&＃xff0c;可以入手的方面较少&＃xff0c;研究起来不太灵活。

我们爬虫第三期来了&＃xff0c;加入我们&＃xff0c;学更实用&＃xff0c;更值钱的 Python 技术&＃xff01;

从0到1系统掌握Python 技术&＃xff08;入门进阶&＃xff09; 2个企业实战项目&＃xff0c;4大常用工具掌握24种反爬策略手段&＃xff0c;成为真正爬虫高手能抓取市面上90%的网站掌握主流爬虫技术&＃xff0c;就业找工作真正全方位帮助大家从0到1&＃xff0c;从 Python 入门到进阶&＃xff0c;转行找爬虫工作。

推荐阅读

install
Python对Excel文件的读取方法及模块安装

本文介绍了Python对Excel文件的读取方法，包括模块的安装和使用。通过安装xlrd、xlwt、xlutils、pyExcelerator等模块，可以实现对Excel文件的读取和处理。具体的读取方法包括打开excel文件、抓取所有sheet的名称、定位到指定的表单等。本文提供了两种定位表单的方式，并给出了相应的代码示例。 ... [详细]

蜡笔小新 2023-12-14 19:49:05
select
安卓select模态框样式改变_微软Office风格的多端（Web、安卓、iOS）组件库——Fabric UI...

介绍FabricUI是微软开源的一套Office风格的多端组件库，共有三套针对性的组件，分别适用于web、android以及iOS，Fab ... [详细]

蜡笔小新 2023-12-14 05:55:08
install
成功安装Sabayon Linux在thinkpad X60上的经验分享

本文分享了作者在国庆期间在thinkpad X60上成功安装Sabayon Linux的经验。通过修改CHOST和执行emerge命令，作者顺利完成了安装过程。Sabayon Linux是一个基于Gentoo Linux的发行版，可以将电脑快速转变为一个功能强大的系统。除了作为一个live DVD使用外，Sabayon Linux还可以被安装在硬盘上，方便用户使用。 ... [详细]

蜡笔小新 2023-12-13 11:35:40
install
Java中闭包的争论以及闭包的定义和特性

闭包一直是Java社区中争论不断的话题，很多语言都支持闭包这个语言特性，闭包定义了一个依赖于外部环境的自由变量的函数，这个函数能够访问外部环境的变量。本文以JavaScript的一个闭包为例，介绍了闭包的定义和特性。 ... [详细]

蜡笔小新 2023-12-13 10:46:54
install
CentOS安装Python2.7.2的步骤和注意事项

本文介绍了在CentOS上安装Python2.7.2的详细步骤，包括下载、解压、编译和安装等操作。同时提供了一些注意事项，以及测试安装是否成功的方法。 ... [详细]

蜡笔小新 2023-12-12 13:54:31
install
基于dlib的人脸68特征点提取(眨眼张嘴检测)python版本

文章目录引言开发环境和库流程设计张嘴和闭眼的检测引言(1)利用Dlib官方训练好的模型“shape_predictor_68_face_landmarks.dat”进行68个点标定 ... [详细]

蜡笔小新 2023-12-12 13:27:42
install
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
go
在Windows 8上安装gvim中的插件的错误加载问题

本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置，但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置，并列出了出现的错误信息。 ... [详细]

蜡笔小新 2023-12-14 14:44:00
go
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
install
Linux下Perl的安装及第一个程序运行

本文介绍了在Linux下安装Perl的步骤，并提供了一个简单的Perl程序示例。同时，还展示了运行该程序的结果。 ... [详细]

蜡笔小新 2023-12-13 18:29:11
default
python创建一个窗口_等一个大佬啊要求用python创建一个窗口，窗口按钮功能是创建一个球体或立方体。明天上课之前交给我...

展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]

蜡笔小新 2023-12-13 16:26:09
default
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
default
如何从列表中删除所有零？

本文介绍了如何使用python从列表中删除所有的零，并将结果以列表形式输出，同时提供了示例格式。 ... [详细]

蜡笔小新 2023-12-13 13:02:00
default
Python瓦片图下载、合并、绘图、标记的代码示例

本文提供了Python瓦片图下载、合并、绘图、标记的代码示例，包括下载代码、多线程下载、图像处理等功能。通过参考geoserver，使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法，供读者参考使用。 ... [详细]

蜡笔小新 2023-12-13 12:14:55
install
RouterOS 5.16软路由安装图解教程

本文介绍了如何安装RouterOS 5.16软路由系统，包括系统要求、安装步骤和登录方式。同时提供了详细的图解教程，方便读者进行操作。 ... [详细]

蜡笔小新 2023-12-12 10:22:22

镜水影快乐

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章