热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

20分钟教会车道保持功能!Wayve公司的强化学习算法有点牛

雷锋网按,AI学会控制一辆汽车沿着道路标线行驶到底要花多久?答案是20分钟。鉴于许多人一辈子都搞不清

20分钟教会车道保持功能!Wayve 公司的强化学习算法有点牛

雷锋网按,AI 学会控制一辆汽车沿着道路标线行驶到底要花多久?答案是 20 分钟。鉴于许多人一辈子都搞不清如何开车走直线,这样的成绩确实令人惊叹。

掌握这项“神技”的是一家名为 Wayve 的英国公司,Wayve 的班底都是来自剑桥大学工程学院的大牛,而他们能完成这项壮举主要靠的是“强化学习”(reinforcement learning)算法。Wayve 公司在博文上表示,只需一位安全司机配合,他们的算法在 15-20 分钟内就能教会一辆车沿着道路标线行驶。

所谓的强化学习又可称之位再励学习、评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。此前,就有许多公司就展现过这项技术的高效,最好的例子就是 DeepMind 旗下横扫人类棋手的 AlphaGo 和 OpenAI 旗下迅速进步的 Dota 2 AI 机器人(每天训练量相当于人类选手 180 天)。

不可否认的是,让 AI 在复杂的棋类和即时战略类游戏中击败人类已经让人惊掉下巴了,而在短时间内教会一辆车如何自我控制更是让人惊叹。

该团队还在 YouTube 频道上传了车辆的学习过程,他们还强调, 这是世界上第一个将“强化学习带上自动驾驶汽车的范例”。

从视频可以看出,最初车辆会像婴儿一样蹒跚学步,在路上蜿蜒前行,但当车辆开始偏离标线,安全驾驶员就会及时介入,将车辆拉回原来的轨道。这样一来,车载算法就知道自己犯了错误,而如果算法长时间不犯错,它们还会拿到奖励的“糖豆”。

据雷锋网 (公众号:雷锋网) 知悉:除了强化学习,Wayve 还用到了“深度卷积神经网络”,它能接收单图片输入,然后只靠一块车载 GPU 就能完成数据处理。 与其他自动驾驶汽车不同,Wayve 的改装版雷诺小车不需要“海量模型、武装到牙齿的传感器和无穷无尽的数据” ,它只需秉承 Wayve 的哲学,使用“一个聪明的训练程序,就能快速和高效的完成学习任务。”

据雷锋网了解,今年 5 月份,它们还参加了 TechCrunch 大会,Wayve联合创始人 Amar Shah 当时就表示: “我们想赋予自动驾驶汽车的是更棒的大脑,而不是更多的硬件。”

“下一步,我们的任务就是扩展这项技术,以应对更多更复杂的驾驶任务,毕竟现在 AI 只不过学会了车道保持这项功能而已。未来,我们希望这套系统能驱动车辆识别交通灯,在环形道路和十字路口应对自如。”Amar Shah 解释道。

雷锋网原创文章,未经授权禁止转载。详情见 转载须知 。

20分钟教会车道保持功能!Wayve 公司的强化学习算法有点牛

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 我们


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 聊聊 中国人工智能科技产业 区域竞争力分析及趋势
    原文链接:聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数(2021ÿ ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 干货 | 携程AI推理性能的自动化优化实践
    作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品,其中性能优化组为AI模型提供全方位的优化方案,提升推理性能降低成本࿰ ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • AstridDAO 专访:波卡稳定币黑马 BAI
    加入Pol ... [详细]
  • 程度|也就是_论文精读:Neural Architecture Search without Training
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了论文精读:NeuralArchitectureSearchwithoutTraining相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 低分辨率和畸变严重的棋盘格角点的自动检测
    文章:AutomaticDetectionofCheckerboardsonBlurredandDistortedImages作者:MartinRufl ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 词袋模型的通俗介绍
    词,袋, ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 用c语言实现线画、填充图元生成算法多边形_【游戏场景剔除】剔除算法综述...
    之前在做场景优化的过程中,看了不少论文和博客阐述不同剔除算法的原理和过程,自己参照着算法去实现了Hiz和软件剔除。一直想写一篇关于剔除算法的综述 ... [详细]
author-avatar
花逝留香人走荼茶凉_442
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有