热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

CoSTNet:多模式交通需求预测

文章信息该文章发表在“The25thACMSIGKDDConferenceonKnowl-edgeDiscovery&DataMining(KDD’19)”,题为《C

1677813978734ec965e47f1f35d2d9ce.png

文章信息

ce99d797478eb183c6ee8703e62d36a9.png

该文章发表在“The 25th ACM SIGKDD Conference on Knowl-edge Discovery & Data Mining (KDD’19)”,题为《Co-Prediction of Multiple Transportation Demands Based on Deep Spatio-Temporal Neural Network》,时间为2019年。该文章主要关注多模式交通需求预测。

05bea88017775ecd956df51f49f2899c.png

摘要

9a3c89f0859305867199e27ea16bf4e9.png

出租车和共享单车给城市交通带来了极大的便利。许多现有研究通过预测下一时期的上下车需求来提高出租车服务或共享单车系统的效率。与现有研究不同,文章的研究动机主要体现在以下两个方面:1)从微观上看,任意时隙的观测空间需求可以分解为多个隐藏空间需求基的组合;2)从宏观上看,多个交通需求在空间和时间上都存在较强的相关性。基于此,文章提出了一种基于时空神经网络的协同预测方法CoST-Net。文章通过构造深度卷积神经网络,将空间需求分解为隐藏空间需求基的组合。用组合权向量表示分解后的空间需求。在此基础上,提出了一种异构长短时记忆算法,对多种运输需求的状态进行集成,并对其进行混合动态建模。最后,将湿度和温度等环境特征与所获得的整体隐藏状态相结合,同时预测多种需求。在真实的出租车和共享单车需求数据上进行了实验,结果表明,所提出的方法优于经典和最新的交通需求预测方法。

文章的创新点如下:

1. 文章设计了一个深度卷积AutoEncoder来实现交通需求的空间分解。基于该网络,可以将快照交通需求编码为空间需求基的组合。

2. 文章提出了一种异构LSTM,以同时建模多种运输需求的动力学,并将它们集成到一个统一的时空神经网络的隐藏状态。

3. 文章根据统一的隐藏状态和外部环境因素,提出了一种协同预测模块,用于预测多种交通需求。

044c3c6397985adf42c8c9d248f2a318.png

问题定义

6514b2a15b1bff7c3b99b1a037f4575c.png

多该文章旨在实现多种交通模式的需求预测,具体而言,文章的多种交通模式指出租车与共享单车。多模式交通需求预测旨在利用多模式交通历史需求信息以及对应的额外特征,预测下一个时间段多模式交通的需求,具体可由下式表示:

817c07b18e9f3427383d28b02fff29c4.png

其中,ca6f20692960ac3549dd043b1146404a.png表示共享单车的历史上下客需求,df1d42e98de1093892242aff070faec4.png表示出租车的上下客需求,表示历史的额外特征,包括天气和事件。

6f27b9278b00768e9b51928a9088825c.png

模型细节

df11f640f0d8787b5972f110bd4f0bd1.png

下图展示了模型的基本框架:

fc5ef3b20f3493eaefd4619f441ebfef.png

1.空间需求分解

ec71a4ead7d5e4e3dee1d2e9e7d938cc.png

如图中图(b)所示,文章认为交通模式的空间需求由若干种基组成,因此,文章假设有一些空间需求基础。它们在不同的时间间隔中是不变的,每一种基础都有其独特的城市表征。此外,各区域在每个时间区间的需求可以看作是空间基的组合,定义如下:

12d8db68d131298efcc5f83b979ff9a9.png

其中,95044c28b15dbaae15829974e4d6afac.png是一种空间需求矩阵,表示区域(i,j)的需求。为保证空间需求库的表达能力,文章对需求库的组合进行了深度非线性设计。因此,组合系数可以嵌入很多次,如下所示。

ae61e15602496f2feb1d4d5312cfe860.png

其中,r表示嵌入层数,表示将低阶分解转化为高阶特征的函数。相应地,可以通过每一层的基底得到Xt的非线性分解。以第r层为例,如下所示。

2ec3378e7af73fb9f0bed2d0ee09d482.png

文章针对空间需求分解问题,共划分为两个部分。首先是分解并获取空间需求基,其次是基于CNN的需求模型

分解并获取空间需求基:

文章提出使用深度卷积AutoEncoder来获得城市交通中的多层基。模型定义如下:

504cf6e2eae32f9d0bffd1746e382113.png

其中,公式(6)表示encoder的结构,(7)表示decoder的结构,7a1900e7d856178e6d76ae2b0984fb10.png是可训练参数。值得注意的是,encoder与decoder是对称的,二者深度相同。

基于CNN的需求模型:

由于在给定时间段t内,历史需求信息可以被视为一张图片,称之为“需求图”,文章选择使用CNN对历史需求数据进行处理。对于一个需求序列,文章将每个需求图输入深度卷积AutoEncoder。不同交通方式的上下车需求具有不同的空间需求基础。为了不影响捕获高级表示的性能,需求图被单独编码。编码器由K层CNN组成,以上一层的输出作为输入。decoder采用encoder的对称结构。CNN的层数和Transposed CNN层数定义如下。

296e02f39c7bb35c63c3a538343d0849.png

其中,r表示层数。值得注意的是,文章在使用CNN时,设置padding为0,因此随着encoder的层数增加,需求图逐渐减小,并输入至异构LSTM中处理,最后后decoder会将需求图放大至原本的大小。

2.异构LSTM

在深度卷积AutoEncoder训练完成后,固定编码器和解码器的参数。因此,给定一个需求图序列,文章对序列进行编码,通过预先训练的编码器获得高阶表示。因为每个特征图都可以看成是空间需求基的组合,所以特征映射序列可以看成是空间基的系数变化。因此,多模式交通需求预测问题被转化为预测下一个时间段的空间需求基的系数。基于RNN的基本表达,该预测问题可由下式表示。

ce4a961b1ebedf6a14b99d6c430084cc.png

其中,3457968085026d3ab5d57860393a25e2.png分别表示共享单车上客,共享单车下客,出租车上客,出租车下客对应的隐藏状态,进一步上式可简化表述如下:

5da8192ce97195092f55ed33b20d7306.png

基本RNN存在爆炸和消失梯度等问题,而随着LSTM的兴起,由于其具有学习时间动态长、短依赖关系的能力,文章选择LSTM进行预测,并提出了针对异构数据的异构LSTM,定义如下:

c699bce29faf8da4d626a1ede2e7507c.png

其中,第一行表示输入门,第二年行表示遗忘门,第三行控制LSTM的输出。

3.融合与协同预测

在这个模型中,文章主要考虑天气和事件。外部因素数据为枚举类型和数值类型,枚举类型将使用one-hot进行编码。编码后,文章使用全连接层来提取外部因素的相关性和表示。异构LSTM的输出由下式表示:

1d743d8202acf59377ae93695132d646.png

其中,表示外部因素,是全连接层。异构LSTM的输出可以分解为四个部分:

27a7dc356aad3c710ff781f4d243c224.png

分别对应出共享单车和出租车的上下客数据。最后,上述数据通过decoder进行解码,得到下一时刻的需求图。值得一提的是,文章中的decoder并不需要训练,如果想要预测共享单车的上客需求,decoder的参数将从预先训练的卷积AutoEncoder中复制,该算法使用共享单车的上客需求作为输入和真实值。定义如下:

84aab65520177946c78c2c41ec1671ab.png

文章的损失函数定义如下:

f5e1e51b52fcf0f4081f1da5f3f9dd3d.png

由于四种模式的权重难以训练,实际上,文章分别对四种需求进行了预测。

5867ea6320d25e43b039aa436b5c084b.png

实验

3f025549bacea6797ed2468fbfdf9971.png

文章选择纽约的共享单车数据与出租车数据作为实验的数据集。实验分为以下几个部分:

1.与基准模型的比对

实验结果如下,可以看到CoST-Net,即文章所以出模型取得了最低的RMSE,以及最高的皮尔森相关系数。

8fdfd1a40446837b1b1e30bd2a733f31.png

93ba27d45b130ae18edda7a80f4e2030.png

2.方差比对

文章将XGBoost、ConvLSTM、DeepST、ST-ResNet和CoST-Net的实验结果绘制了箱线图。

1622e4fbbed768a9e69e4fe40ceebf06.png

3.CoST-Net与其变种的比对

具体而言,例如,如果期望预测共享单车的上客需求,使用单通道的实验(“A Channel”)意味着只使用共享单车的上客需求数据来用我们的模型进行预测。双通道预测(“Two Channels”)表示采用自行车提车需求和自行车落车需求数据进行实验。而四个输入通道表示原始的CoST-Net。

8e8705d8d738cfe8119382ff861e6a82.png

4.在不同时间点的模型性能

f62ac79a61a386e6a39d179cbd310ed2.png

3f1463724c8a8e7c4b40608e75eb17e2.png

总结

dbc19cbd0dfcabed6ba4fa0125c16a63.png

文章提出了一种新的交通需求预测方法,即基于时空神经网络的协同预测。它由三个模块组成:1)表示学习模块,将空间需求分布编码为隐藏的空间需求基的组合;2)异构学习模块,融合多种交通需求状态,并对这些状态进行动态建模;3)融合环境因素的集成模块,提出多种交通需求的预测。得益于多种交通需求的空间分解表示和异构融合,CoST-Net能够优于现有的交通需求预测方法。为了验证文章提出的方法,在真实出租车和共享单车数据上进行了实验,结果证明了CoST-Net在预测精度和鲁棒性方面的有效性。

a05dcaef389480aafecfb985c36cf936.png

Attention

d039e6ad8f2326c59402efdaed70c1e1.png

欢迎关注微信公众号《当交通遇上机器学习》!如果你和我一样是轨道交通、道路交通、城市规划相关领域的,也可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!


推荐阅读
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 三角测量计算三维坐标的代码_双目三维重建——层次化重建思考
    双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记,本文从宏观的角度阐 ... [详细]
  • 对于众多创业公司而言,选择小程序或小视频的发展方向至关重要。本文将深入分析小程序和小视频的特点、优势及局限,帮助创业者做出更明智的选择。 ... [详细]
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • 机器学习算法:SVM(支持向量机)
    SVM算法(SupportVectorMachine,支持向量机)的核心思想有2点:1、如果数据线性可分,那么基于最大间隔的方式来确定超平面,以确保全局最优, ... [详细]
  • 专业人士如何做自媒体 ... [详细]
  • 解决Only fullscreen opaque activities can request orientation错误的方法
    本文介绍了在使用PictureSelectorLight第三方框架时遇到的Only fullscreen opaque activities can request orientation错误,并提供了一种有效的解决方案。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 微信公众号推送模板40036问题
    返回码错误码描述说明40001invalidcredential不合法的调用凭证40002invalidgrant_type不合法的grant_type40003invalidop ... [详细]
  • javascript分页类支持页码格式
    前端时间因为项目需要,要对一个产品下所有的附属图片进行分页显示,没考虑ajax一张张请求,所以干脆一次性全部把图片out,然 ... [详细]
  • 如何在Linux服务器上配置MySQL和Tomcat的开机自动启动
    在Linux服务器上部署Web项目时,通常需要确保MySQL和Tomcat服务能够随系统启动而自动运行。本文将详细介绍如何在Linux环境中配置MySQL和Tomcat的开机自启动,以确保服务的稳定性和可靠性。通过合理的配置,可以有效避免因服务未启动而导致的项目故障。 ... [详细]
  • 在本文中,我们将详细介绍如何构建一个用于自动回复消息的XML类。当微信服务器接收到用户消息时,该类将生成相应的自动回复消息。以下是具体的代码实现:```phpclass We_Xml { // 代码内容}```通过这个类,开发者可以轻松地处理各种消息类型,并实现高效的自动回复功能。我们将深入探讨类的各个方法和属性,帮助读者更好地理解和应用这一技术。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
author-avatar
奥巴马萨达姆_558
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有