热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

CoSTNet:多模式交通需求预测

文章信息该文章发表在“The25thACMSIGKDDConferenceonKnowl-edgeDiscovery&DataMining(KDD’19)”,题为《C

1677813978734ec965e47f1f35d2d9ce.png

文章信息

ce99d797478eb183c6ee8703e62d36a9.png

该文章发表在“The 25th ACM SIGKDD Conference on Knowl-edge Discovery & Data Mining (KDD’19)”,题为《Co-Prediction of Multiple Transportation Demands Based on Deep Spatio-Temporal Neural Network》,时间为2019年。该文章主要关注多模式交通需求预测。

05bea88017775ecd956df51f49f2899c.png

摘要

9a3c89f0859305867199e27ea16bf4e9.png

出租车和共享单车给城市交通带来了极大的便利。许多现有研究通过预测下一时期的上下车需求来提高出租车服务或共享单车系统的效率。与现有研究不同,文章的研究动机主要体现在以下两个方面:1)从微观上看,任意时隙的观测空间需求可以分解为多个隐藏空间需求基的组合;2)从宏观上看,多个交通需求在空间和时间上都存在较强的相关性。基于此,文章提出了一种基于时空神经网络的协同预测方法CoST-Net。文章通过构造深度卷积神经网络,将空间需求分解为隐藏空间需求基的组合。用组合权向量表示分解后的空间需求。在此基础上,提出了一种异构长短时记忆算法,对多种运输需求的状态进行集成,并对其进行混合动态建模。最后,将湿度和温度等环境特征与所获得的整体隐藏状态相结合,同时预测多种需求。在真实的出租车和共享单车需求数据上进行了实验,结果表明,所提出的方法优于经典和最新的交通需求预测方法。

文章的创新点如下:

1. 文章设计了一个深度卷积AutoEncoder来实现交通需求的空间分解。基于该网络,可以将快照交通需求编码为空间需求基的组合。

2. 文章提出了一种异构LSTM,以同时建模多种运输需求的动力学,并将它们集成到一个统一的时空神经网络的隐藏状态。

3. 文章根据统一的隐藏状态和外部环境因素,提出了一种协同预测模块,用于预测多种交通需求。

044c3c6397985adf42c8c9d248f2a318.png

问题定义

6514b2a15b1bff7c3b99b1a037f4575c.png

多该文章旨在实现多种交通模式的需求预测,具体而言,文章的多种交通模式指出租车与共享单车。多模式交通需求预测旨在利用多模式交通历史需求信息以及对应的额外特征,预测下一个时间段多模式交通的需求,具体可由下式表示:

817c07b18e9f3427383d28b02fff29c4.png

其中,ca6f20692960ac3549dd043b1146404a.png表示共享单车的历史上下客需求,df1d42e98de1093892242aff070faec4.png表示出租车的上下客需求,表示历史的额外特征,包括天气和事件。

6f27b9278b00768e9b51928a9088825c.png

模型细节

df11f640f0d8787b5972f110bd4f0bd1.png

下图展示了模型的基本框架:

fc5ef3b20f3493eaefd4619f441ebfef.png

1.空间需求分解

ec71a4ead7d5e4e3dee1d2e9e7d938cc.png

如图中图(b)所示,文章认为交通模式的空间需求由若干种基组成,因此,文章假设有一些空间需求基础。它们在不同的时间间隔中是不变的,每一种基础都有其独特的城市表征。此外,各区域在每个时间区间的需求可以看作是空间基的组合,定义如下:

12d8db68d131298efcc5f83b979ff9a9.png

其中,95044c28b15dbaae15829974e4d6afac.png是一种空间需求矩阵,表示区域(i,j)的需求。为保证空间需求库的表达能力,文章对需求库的组合进行了深度非线性设计。因此,组合系数可以嵌入很多次,如下所示。

ae61e15602496f2feb1d4d5312cfe860.png

其中,r表示嵌入层数,表示将低阶分解转化为高阶特征的函数。相应地,可以通过每一层的基底得到Xt的非线性分解。以第r层为例,如下所示。

2ec3378e7af73fb9f0bed2d0ee09d482.png

文章针对空间需求分解问题,共划分为两个部分。首先是分解并获取空间需求基,其次是基于CNN的需求模型

分解并获取空间需求基:

文章提出使用深度卷积AutoEncoder来获得城市交通中的多层基。模型定义如下:

504cf6e2eae32f9d0bffd1746e382113.png

其中,公式(6)表示encoder的结构,(7)表示decoder的结构,7a1900e7d856178e6d76ae2b0984fb10.png是可训练参数。值得注意的是,encoder与decoder是对称的,二者深度相同。

基于CNN的需求模型:

由于在给定时间段t内,历史需求信息可以被视为一张图片,称之为“需求图”,文章选择使用CNN对历史需求数据进行处理。对于一个需求序列,文章将每个需求图输入深度卷积AutoEncoder。不同交通方式的上下车需求具有不同的空间需求基础。为了不影响捕获高级表示的性能,需求图被单独编码。编码器由K层CNN组成,以上一层的输出作为输入。decoder采用encoder的对称结构。CNN的层数和Transposed CNN层数定义如下。

296e02f39c7bb35c63c3a538343d0849.png

其中,r表示层数。值得注意的是,文章在使用CNN时,设置padding为0,因此随着encoder的层数增加,需求图逐渐减小,并输入至异构LSTM中处理,最后后decoder会将需求图放大至原本的大小。

2.异构LSTM

在深度卷积AutoEncoder训练完成后,固定编码器和解码器的参数。因此,给定一个需求图序列,文章对序列进行编码,通过预先训练的编码器获得高阶表示。因为每个特征图都可以看成是空间需求基的组合,所以特征映射序列可以看成是空间基的系数变化。因此,多模式交通需求预测问题被转化为预测下一个时间段的空间需求基的系数。基于RNN的基本表达,该预测问题可由下式表示。

ce4a961b1ebedf6a14b99d6c430084cc.png

其中,3457968085026d3ab5d57860393a25e2.png分别表示共享单车上客,共享单车下客,出租车上客,出租车下客对应的隐藏状态,进一步上式可简化表述如下:

5da8192ce97195092f55ed33b20d7306.png

基本RNN存在爆炸和消失梯度等问题,而随着LSTM的兴起,由于其具有学习时间动态长、短依赖关系的能力,文章选择LSTM进行预测,并提出了针对异构数据的异构LSTM,定义如下:

c699bce29faf8da4d626a1ede2e7507c.png

其中,第一行表示输入门,第二年行表示遗忘门,第三行控制LSTM的输出。

3.融合与协同预测

在这个模型中,文章主要考虑天气和事件。外部因素数据为枚举类型和数值类型,枚举类型将使用one-hot进行编码。编码后,文章使用全连接层来提取外部因素的相关性和表示。异构LSTM的输出由下式表示:

1d743d8202acf59377ae93695132d646.png

其中,表示外部因素,是全连接层。异构LSTM的输出可以分解为四个部分:

27a7dc356aad3c710ff781f4d243c224.png

分别对应出共享单车和出租车的上下客数据。最后,上述数据通过decoder进行解码,得到下一时刻的需求图。值得一提的是,文章中的decoder并不需要训练,如果想要预测共享单车的上客需求,decoder的参数将从预先训练的卷积AutoEncoder中复制,该算法使用共享单车的上客需求作为输入和真实值。定义如下:

84aab65520177946c78c2c41ec1671ab.png

文章的损失函数定义如下:

f5e1e51b52fcf0f4081f1da5f3f9dd3d.png

由于四种模式的权重难以训练,实际上,文章分别对四种需求进行了预测。

5867ea6320d25e43b039aa436b5c084b.png

实验

3f025549bacea6797ed2468fbfdf9971.png

文章选择纽约的共享单车数据与出租车数据作为实验的数据集。实验分为以下几个部分:

1.与基准模型的比对

实验结果如下,可以看到CoST-Net,即文章所以出模型取得了最低的RMSE,以及最高的皮尔森相关系数。

8fdfd1a40446837b1b1e30bd2a733f31.png

93ba27d45b130ae18edda7a80f4e2030.png

2.方差比对

文章将XGBoost、ConvLSTM、DeepST、ST-ResNet和CoST-Net的实验结果绘制了箱线图。

1622e4fbbed768a9e69e4fe40ceebf06.png

3.CoST-Net与其变种的比对

具体而言,例如,如果期望预测共享单车的上客需求,使用单通道的实验(“A Channel”)意味着只使用共享单车的上客需求数据来用我们的模型进行预测。双通道预测(“Two Channels”)表示采用自行车提车需求和自行车落车需求数据进行实验。而四个输入通道表示原始的CoST-Net。

8e8705d8d738cfe8119382ff861e6a82.png

4.在不同时间点的模型性能

f62ac79a61a386e6a39d179cbd310ed2.png

3f1463724c8a8e7c4b40608e75eb17e2.png

总结

dbc19cbd0dfcabed6ba4fa0125c16a63.png

文章提出了一种新的交通需求预测方法,即基于时空神经网络的协同预测。它由三个模块组成:1)表示学习模块,将空间需求分布编码为隐藏的空间需求基的组合;2)异构学习模块,融合多种交通需求状态,并对这些状态进行动态建模;3)融合环境因素的集成模块,提出多种交通需求的预测。得益于多种交通需求的空间分解表示和异构融合,CoST-Net能够优于现有的交通需求预测方法。为了验证文章提出的方法,在真实出租车和共享单车数据上进行了实验,结果证明了CoST-Net在预测精度和鲁棒性方面的有效性。

a05dcaef389480aafecfb985c36cf936.png

Attention

d039e6ad8f2326c59402efdaed70c1e1.png

欢迎关注微信公众号《当交通遇上机器学习》!如果你和我一样是轨道交通、道路交通、城市规划相关领域的,也可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 拥抱Android Design Support Library新变化(导航视图、悬浮ActionBar)
    转载请注明明桑AndroidAndroid5.0Loollipop作为Android最重要的版本之一,为我们带来了全新的界面风格和设计语言。看起来很受欢迎࿰ ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 手把手教你使用GraphPad Prism和Excel绘制回归分析结果的森林图
    本文介绍了使用GraphPad Prism和Excel绘制回归分析结果的森林图的方法。通过展示森林图,可以更加直观地将回归分析结果可视化。GraphPad Prism是一款专门为医学专业人士设计的绘图软件,同时也兼顾统计分析的功能,操作便捷,可以帮助科研人员轻松绘制出高质量的专业图形。文章以一篇发表在JACC杂志上的研究为例,利用其中的多因素回归分析结果来绘制森林图。通过本文的指导,读者可以学会如何使用GraphPad Prism和Excel绘制回归分析结果的森林图。 ... [详细]
  • 本文介绍了前端人员必须知道的三个问题,即前端都做哪些事、前端都需要哪些技术,以及前端的发展阶段。初级阶段包括HTML、CSS、JavaScript和jQuery的基础知识。进阶阶段涵盖了面向对象编程、响应式设计、Ajax、HTML5等新兴技术。高级阶段包括架构基础、模块化开发、预编译和前沿规范等内容。此外,还介绍了一些后端服务,如Node.js。 ... [详细]
  • 词袋模型的通俗介绍
    词,袋, ... [详细]
  • macOS Big Sur全新设计大版本更新,10+个值得关注的新功能
    本文介绍了Apple发布的新一代操作系统macOS Big Sur,该系统采用全新的界面设计,包括图标、应用界面、程序坞和菜单栏等方面的变化。新系统还增加了通知中心、桌面小组件、强化的Safari浏览器以及隐私保护等多项功能。文章指出,macOS Big Sur的设计与iPadOS越来越接近,结合了去年iPadOS对鼠标的完善等功能。 ... [详细]
  • 北京景点排行榜 北京最好玩的旅游景点
    2019北京最好玩的旅游景点有哪些?下文为大家整理了2019北京景点排行榜,希望可以帮到您哦!  2019北京景点排行榜:  1、故宫  帝都必打卡的地点之一。  北京故宫是中国明 ... [详细]
author-avatar
奥巴马萨达姆_558
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有