当前位置: 开发笔记 > 编程语言 > 正文

用于强化学习的自动驾驶仿真场景highwayenv(1)

作者：手机用户2602899031 | 来源：互联网 | 2023-09-17 10:39

在强化学习过程中，一个可交互，可定制，直观的交互场景必不可少。最近发现一个自动驾驶的虚拟环境，本文主要来说明下如何使用该e

在强化学习过程中&＃xff0c;一个可交互&＃xff0c;可定制&＃xff0c;直观的交互场景必不可少。

最近发现一个自动驾驶的虚拟环境&＃xff0c;本文主要来说明下如何使用该environment
在这里插入图片描述

具体项目的github地址

一、定制环境

quickly experience

如下代码可以快速创建一个env

import gym import highway_env from matplotlib import pyplot as pltenv &＃61; gym.make(&＃39;highway-v0&＃39;) env.reset()for _ in range(10):action &＃61; env.action_type.actions_indexes["IDLE"]obs, reward, down, info &＃61; env.step(action)env.render() plt.imshow(env.render(mode&＃61;"rgb_array")) plt.show()

运行结果如下所示&＃xff1a;
在这里插入图片描述
所有的场景包括五种&＃xff0c;上文只是说明其中的highway高速路场景。
接下来&＃xff0c;我们详细说明五种场景。

1. highway

特点

速度越快&＃xff0c;奖励越高
靠右行驶&＃xff0c;奖励高
与其他car交互实现避障

使用

env &＃61; gym.make("highway-v0")

默认参数

{"observation": {"type": "Kinematics"},"action": {"type": "DiscreteMetaAction",},"lanes_count": 4,"vehicles_count": 50,"duration": 40, # [s]"initial_spacing": 2,"collision_reward": -1, # 与其他车发生碰撞的reword"reward_speed_range": [20, 30], # [m/s] -> [0, HighwayEnv.HIGH_SPEED_REWARD]线性映射."simulation_frequency": 15, # [Hz]"policy_frequency": 1, # [Hz]"other_vehicles_type": "highway_env.vehicle.behavior.IDMVehicle","screen_width": 600, # [px]"screen_height": 150, # [px]"centering_position": [0.3, 0.5],"scaling": 5.5,"show_trajectories": False,"render_agent": True,"offscreen_rendering": False }

2. merge

特点

首先在主路&＃xff0c;然后前方遇到并道
并道上有car
要求实现安全并道

使用

env &＃61; gym.make("merge-v0")

默认参数

{"observation": {"type": "TimeToCollision"},"action": {"type": "DiscreteMetaAction"},"simulation_frequency": 15, # [Hz]"policy_frequency": 1, # [Hz]"other_vehicles_type": "highway_env.vehicle.behavior.IDMVehicle","screen_width": 600, # [px]"screen_height": 150, # [px]"centering_position": [0.3, 0.5],"scaling": 5.5,"show_trajectories": False,"render_agent": True,"offscreen_rendering": False }

3. roundabout

特点

环形公路
longitudinal control

使用

env &＃61; gym.make("roundabout-v0")

默认参数

{"observation": {"type": "TimeToCollision"},"action": {"type": "DiscreteMetaAction"},"incoming_vehicle_destination": None,"duration": 11,"simulation_frequency": 15, # [Hz]"policy_frequency": 1, # [Hz]"other_vehicles_type": "highway_env.vehicle.behavior.IDMVehicle","screen_width": 600, # [px]"screen_height": 600, # [px]"centering_position": [0.5, 0.6],"scaling": 5.5,"show_trajectories": False,"render_agent": True,"offscreen_rendering": False }

4. parking

特点

停车场
合适的朝向停到合适的车位

使用

env &＃61; gym.make("parking-v0")

默认参数

{"observation": {"type": "KinematicsGoal","features": [&＃39;x&＃39;, &＃39;y&＃39;, &＃39;vx&＃39;, &＃39;vy&＃39;, &＃39;cos_h&＃39;, &＃39;sin_h&＃39;],"scales": [100, 100, 5, 5, 1, 1],"normalize": False},"action": {"type": "ContinuousAction"},"simulation_frequency": 15,"policy_frequency": 5,"screen_width": 600,"screen_height": 300,"centering_position": [0.5, 0.5],"scaling": 7"show_trajectories": False,"render_agent": True,"offscreen_rendering": False

5. intersection

特点

十字路口
左转

使用

env &＃61; gym.make("intersection-v0")

默认参数

{"observation": {"type": "Kinematics","vehicles_count": 15,"features": ["presence", "x", "y", "vx", "vy", "cos_h", "sin_h"],"features_range": {"x": [-100, 100],"y": [-100, 100],"vx": [-20, 20],"vy": [-20, 20],},"absolute": True,"flatten": False,"observe_intentions": False},"action": {"type": "DiscreteMetaAction","longitudinal": False,"lateral": True},"duration": 13, # [s]"destination": "o1","initial_vehicle_count": 10,"spawn_probability": 0.6,"screen_width": 600,"screen_height": 600,"centering_position": [0.5, 0.6],"scaling": 5.5 * 1.3,"collision_reward": IntersectionEnv.COLLISION_REWARD,"normalize_reward": False }

二、关于参数

打印当前参数

import gym import highway_env import pprintenv &＃61; gym.make(&＃39;highway-v0&＃39;) env.reset() pprint.pprint(env.config)

output&＃xff1a;
在这里插入图片描述

配置参数

env.config["lanes_count"] &＃61; 2 env.reset()

output:
在这里插入图片描述

三、训练agent

场景与很多对应的算法平台可以直接对接。比如&＃xff1a;

rl-agents
baselines
stable-baselines

example
使用stable-baselines的一个demo&＃xff1a;

import gym import highway_env import numpy as npfrom stable_baselines import HER, SAC, DDPG, TD3 from stable_baselines.ddpg import NormalActionNoiseenv &＃61; gym.make("parking-v0")n_sampled_goal &＃61; 4model &＃61; HER(&＃39;MlpPolicy&＃39;, env, SAC, n_sampled_goal&＃61;n_sampled_goal,goal_selection_strategy&＃61;&＃39;future&＃39;, verbose&＃61;1,buffer_size&＃61;int(1e6),learning_rate&＃61;1e-3,gamma&＃61;0.95, batch_size&＃61;256,policy_kwargs&＃61;dict(layer&＃61;[256, 256, 256]))model.learn(int(2e5)) model.save(&＃39;her_sac_highway&＃39;)obs &＃61; env.reset()# 100次的reward作为评价指标 episode_reward &＃61; 0 for _ in range(100):action, _ &＃61; model.predict(obs)obs, reward, done, info &＃61; env.step(action)env.render()episode_reward &＃43;&＃61; rewardif done or info.get(&＃39;is_success&＃39;, False):print("Reward:", episode_reward, "Success?", info.get(&＃39;is_success&＃39;, False))episode_reward &＃61; 0.0obs &＃61; env.reset()

推荐阅读

go
当人工智能（AI）撞上供应链

了解供应链简单来说，供应链涉及一系列旨在向最终用户提供产品或服务的步骤。企业组织及其供应商之间始终存在一个网络，来生产特定产品并将其交付给最终用户。该网络包括不同的活动、人员、实体 ... [详细]

蜡笔小新 2024-10-11 18:25:31
go
每日一书丨AI圣经《深度学习》作者斩获2018年图灵奖

2019年3月27日——ACM宣布，深度学习之父YoshuaBengio,YannLeCun,以及GeoffreyHinton获得了2018年的图灵奖， ... [详细]

蜡笔小新 2024-09-27 16:03:32
go
Ubuntu 14.04 环境下搭建 Caffe（仅限 CPU）

本文详细介绍了如何在 Ubuntu 14.04 系统上搭建仅使用 CPU 的 Caffe 深度学习框架，包括环境准备、依赖安装及编译过程。 ... [详细]

蜡笔小新 2024-11-22 16:43:30
import
CentOS 7 下 Python 3.7 的安装与配置

本文详细介绍了在 CentOS 7 系统中安装 Python 3.7 的步骤，包括编译工具的安装、Python 3.7 源码的下载与编译、软链接的创建以及常见错误的处理方法。 ... [详细]

蜡笔小新 2024-11-18 12:21:04
go
汽车电子架构与CAN网络基础解析——鉴源实验室专业解读

汽车电子架构与CAN网络基础解析——鉴源实验室专业解读 ... [详细]

蜡笔小新 2024-11-06 14:10:48
less
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
less
语义、实例与全景分割的对比分析（Comparative Analysis of Semantic, Instance, and Panoptic Segmentation）

图像分割技术在人工智能领域中扮演着关键角色，其中语义分割、实例分割和全景分割是三种主要的方法。本文对这三种分割技术进行了详细的对比分析，探讨了它们在不同应用场景中的优缺点和适用范围，为研究人员和从业者提供了有价值的参考。 ... [详细]

蜡笔小新 2024-10-29 18:51:14
import
【自动驾驶】second模型训练

1，数据组织：训练验证数据生成：pythoncreate_data.pynuscenes_data_prep--data_pathNU ... [详细]

蜡笔小新 2024-09-25 22:18:52
import
Java程序设计复习题

1、编写一个Java程序在屏幕上输出“你好！”。programmenameHelloworld.javapublicclassHelloworld{publicst ... [详细]

蜡笔小新 2024-11-22 20:05:03
go
视觉Transformer综述

本文综述了视觉Transformer在计算机视觉领域的应用，从原始Transformer出发，详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构，还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]

蜡笔小新 2024-11-22 19:53:16
datetime
D17：C#设计模式之十六观察者模式（Observer Pattern）【行为型】

一、引言今天是2017年11月份的最后一天，也就是2017年11月30日，利用今天再写一个模式，争取下个月（也就是12月份& ... [详细]

蜡笔小新 2024-11-22 19:45:55
go
解析 .NET 中的 AJAX 技术

Asynchronous JavaScript and XML (AJAX) 的流行很大程度上得益于 Google 在其产品如 Google Suggest 和 Google Maps 中的应用。本文将深入探讨 AJAX 在 .NET 环境下的工作原理及其实现方法。 ... [详细]

蜡笔小新 2024-11-22 18:18:57
string
Redis 数据类型及其应用场景

本文详细介绍了 Redis 中的主要数据类型，包括 String、Hash、List、Set、ZSet、Geo 和 HyperLogLog，并提供了每种类型的基本操作命令和应用场景。 ... [详细]

蜡笔小新 2024-11-22 15:36:30
string
fleaframedb使用之JPA封装介绍

flea,frame,db,使用,之 ... [详细]

蜡笔小新 2024-11-20 12:00:16
go
编程语言概述与Python变量详解

本文介绍了编程语言的基本分类，包括机器语言、汇编语言和高级语言的特点及其优缺点。随后详细讲解了Python解释器的安装与配置方法，并探讨了Python变量的定义、使用及内存管理机制。 ... [详细]

蜡笔小新 2024-11-17 09:03:36

手机用户2602899031

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

用于强化学习的自动驾驶仿真场景highwayenv(1)

一、 定制环境

1. highway

2. merge

3. roundabout

4. parking

5. intersection

二、关于参数

三、训练agent

一、定制环境