当前位置: 开发笔记 > 编程语言 > 正文

MVGCN人群流量预测模型笔记

作者：雪狱冰魂_520 | 来源：互联网 | 2023-08-29 13:39

PredictingCitywideCrowdFlowsinIrregularRegionsUsingMulti-ViewGraphconvolutionalNetworks笔记作

Predicting Citywide Crowd Flows in Irregular Regions Using Multi-View Graph convolutional Networks 笔记

作者：Junkai Sun, Junbo Zhang, Qiaofei Li, Xiuwen Yi, Yu Zheng

来源：arXiv:1903.07789v2 [cs.CV] 17 Jul 2020

1 论文背景与动机

先前的工作主要集中在预测规则的网格化区域的人群流动。然而，城市实际上被道路网络隔开，非常不规则。预测城市不规则区域的人群流动，对于交通控制、风险评估和公共安全意义重大。

人群流量预测问题是一个时空图(STG)预测问题，不规则区域为图节点，区域间过渡流用来构造边。但由于不同区域之间的相互作用和空间相关性，不规则区域人群流量预测比较困难，受到许多因素影响：

1）STG不同顶点之间的相互作用和空间相关性。

2）不同时间间隔之间的多重时间相关性：邻近性、周期性、趋势；

3）复杂的外部因素（天气、事件）和元特征（一天的时间，周末/工作日）

本文提出利用空间图卷积建立一个多视角图卷积网络(MVGCN)，用于人群流量预测问题，其中不同视角能捕捉到上述不同的因素。本文使用四个数据集来评估MVGCN，结果表明，MVGCN方法优于最先进的方法。

2论文创新

2.1提出一种GCN变体，它可以捕捉不同节点之间的空间相关性。设计多视图融合模块，将不同视图的多个潜在表示融合在一起。多视图融合有效地利用不同视图基于其特性的输出。

2.2 提出了一个综合框架，包括数据预处理、地图分割和地图聚类、过渡流构建图、GCN预测人群流量。

3论文模型

《MVGCN 人群流量预测模型笔记》

该框架由数据准备和模型学习两个阶段组成：

数据准备阶段：基于预测的目标时间获取全局信息（比如，如以前的时间步骤中的气象数据和天气预报。Iext and Imeta,），基于时间依赖（考虑两类时段（日，周)，两类趋势(月，季），选取相应的近期，日，周，月，季的时间步骤为重点时间步骤，构建五个视图。）选择关键的 key timesteps（通过选择这些关键的时间步骤，MVGCN可以捕获多种类型的时间属性。）；然后将它们全部喂入到第二阶段进行模型训练。
模型学习阶段：1）GCNs用STG结构信息学习（每个时间视图）空间相关性和相互作用，输出；2)FNNs捕获全局信息，如外部因素和元特征，；3）Multi-view fusion（多视角融合）集成GCNs和FNNs的输出；4）Post-net, 即FNN, 使用激活函数将潜在表示投影获得预测值，输出。

人群流量预测问题——STG预测问题：

节点——不规则区域；边——流出和区域之间的过渡流。

Inflow&＃8211; 给定时间间隔内其他区域进入某区域的人群的总流量；

Outflow&＃8211;给定时间内离开某区域到其他区域的人群的总流量。

通过在道路上行驶的汽车/自行车的数量、行人的数量、在公共交通系统上行驶的人数来衡量人群的流量。利用车辆的GPS轨迹来测量交通流量。

map segmentation：

1）利用形态学图像处理技术来处理区域划分任务，即将地图划分为2400个×2400个小网格单元，并将每个路点映射到其对应点网格单元，从而获得二值图像，1和0分别代表路段和空白区域。

2）应用dilation和thinning得到路网骨架。

3）使用连接分量标记算法(CCL)获得所有标记的不规则区域的位置，该算法通过聚类“1”标记的网格找到单个区域。

Map clustering:

把两个低层区域之间的边缘权重定义为一个时段内的平均人群流量之间的Spearman&＃8217;s rankcorrelation coefficient。小区域被聚集成一些高级别区域

Graph Construction——使用历史区域过渡流的拓扑图。

从流量数据中选择一段时间，比如一到两个月。然后，可以统计成对区域之间的有效时间切片。有效时间片是指考虑轨迹数据的噪声，当区域过渡流>α 当区域过渡的有效时间切片比大于阈值β时，PLA一个二进制值无向边来连接它们。α=3，β=0.1。

每个顶点vi∈V都有一个地理空间位置pi和时变属性。这些属性在时间t上可以看作是图信号Xt∈RN×C，其中Xt[i，：]∈RC表示节点vi的C个属性，例如流入和流出（C=2）。两个区域之间的边缘是由区域过渡流构造的。两个区域之间的边缘是由区域向过渡流构造的，A中的二进制入口值表示两个区域在交通流中是否相关。

模型输入：原始轨迹和道路网络。

模型输出：城市的不规则区域的人群流入和流出（inflows/outflows）。

4 算法步骤

4.1 给定一个邻接矩阵A，根据空间距离为现有边分配空间权值。考虑了在STG中顶点的地理空间位置。 S∈RN×N是修正的邻接矩阵，《MVGCN 人群流量预测模型笔记》；

4.2 ω∈RN×N是通过阈值高斯核加权函数计算的空间加权邻接矩阵。 dist(pi，pj)是指节点vi和vj之间的地理距离；θ和κ是控制邻接矩阵的尺度和稀疏性的两个参数。

《MVGCN 人群流量预测模型笔记》

4.3 stack M spatial graph convolutional layers 卷积整合了地理空间信息

《MVGCN 人群流量预测模型笔记》

4.4 为捕捉M-hop空间相关性和相互作用，叠加了M空间图卷积层。当M很大时，我们需要一个非常深的网络。残差学习允许神经网络具有100层的超深结构。通过叠加多个基于GCN的残差单元，可以构建非常深的神经网络来捕获多跳空间依赖

《MVGCN 人群流量预测模型笔记》

4.5 提出一种多视图融合方法，将许多流视图的潜在表示与两个全局视图（外部和元数据)融合。不同的区域具有不同的时间性质。采用基于参数矩阵的融合方法将五个GCN的输出融合为时间视图。 W1—W5分别调节受临近、日周期、周周期、月趋势和季度趋势影响的程度。

《MVGCN 人群流量预测模型笔记》

4.6 Iext和元数据Imeta分别将喂入不同的FC层中，以获得不同的潜在表示Øext和Ømeta。只需连接嵌入模块的所有输出，通过整形添加FC层，获得Ocon∈RN×C。

4.7不同的因素可能以不同的方式改变流动。利用两种不同的融合方法：对于逐步变化，采用求和融合方法《MVGCN 人群流量预测模型笔记》，对于突然的变化，用基于门控机制的融合，其中σ是一个近似的门控函数。当Ocon的级联表示捕获一些特殊的外部信息，如暴雨天气时，由于sigmoid 函数性质，将突然增加，相比Ocon成为一个更大的值。而在大多数常见的情况下，它应该接近于零，没有突然的变化。基于两种融合方法，最终输出计算为

《MVGCN 人群流量预测模型笔记》

4.8 胡伯损失是《MVGCN 人群流量预测模型笔记》和折衷， δ为阈值（默认值为1）.Huber损失结合了零附近平方误差损失和绝对误差损失理想性质。

《MVGCN 人群流量预测模型笔记》

5 论文实验

5.1 数据集

1）TaxiNYC：2011年1月1日—2016年6月30日纽约市的出租车GPS数据。将NYC划分为100个不规则区域，据过渡流和区域间的地理距离建立图，计算人群流量。

2）TaxiBJ：北京出租车GPS数据，四个时间间隔：2013年7月1日—2013年10月30日，2014年3月1日—2014年6月30日，2015年3月1日—2015年6月30日，2015年11月1日—2016年4月10日。构图和人群流量计算方法与TaxiNYC相同。

3）BikeDC：取自华盛顿特区自行车系统。行程数据包括：行程持续时间，起止站ID，起止时间。共有472个站点。对于每个车站，两种流量，流入是进入自行车的数量，流出是签出自行车的数量。120个不规则区域。构造了这些区域之间具有过渡流和地理距离的图。

4）BikeNYC：取自纽约自行车系统，2013年7月1日—2016年12月31日轨迹数据。共有416个车站。删除了不可用的自行车站点，并将其余的站点集中到120个区域。纽约市的图形构造和自行车流量计算方法与BikeDC相同。

《MVGCN 人群流量预测模型笔记》

上述四个数据集：测试集——最后四周的数据；训练集——所有剩余数据。

本文过站点或区域之间的地理距离建立通勤网络(即图)，站点或区域可以看作是图中的节点。每个站点都有地理空间位置。对每个区域，近似地使用区域中心位置的地理空间位置。

5.2 对比方法

time-series models： 1）HA: Historical average 2）VAR: Vector auto-regressive

use the spatial and temporal features 3）GBRT: Gradient boosting decision tree

neural networks：

4）FC-LSTM: Encoder-decoder framework using LSTM

5）GCN: 3-layer supervised graph convolutional network

6）DCRNN: 2-layer supervised diffusion convolutional recurrent neural network

7）ST-MGCN: Forecasting ride-hailing demand with spatiotemporal multi-graph convolution network.

based on Gaussian Markov random fields：

8） FCCF: Forecasting Citywide Crowd Flow model based on Gaussian Markov random fields

9）FCCFno Trans

说明：1）利用TensorFlow实现基于神经网络的模型，并通过反向传播和Adam[17]优化进行训练。 2）MVGCN模型以及大多数对比方法都用TensorFlow实现，模型训练过程在两个具有64GB RAM和16GB GPU内存的TeslaV100GPU上执行。训练时间因时间而异在不同的数据集上30分钟到3小时。

5.3 预处理

使用Min-Max归一化方法将数据缩放到范围[1,1]或[0,1]。在评估中，将预测值重新缩放到正常值，并与真值比较。

对于外部因素，使用独热编码将元数据、假日和天气条件转换为二进制向量使用Min-Max归一化将温度和风速缩放到[0,1]。

5.4 环境设置

模型超参数设置如下：

对于五个依赖序列的长度，lr、ld、lw、lm、lq∈{0，···，6}。
图卷积层数设为{3，…，7}，不使用正则化。
每个嵌入层的隐藏单元默认设置为10。
训练数据分三部分：测试集——最后四周数据作为，验证集——相邻的前四周的数据作为，训练集——其余数据。验证集，通过早期停止控制训练过程以及基于最佳验证分数选择模型最终parameters。
批次大小32。
学习率定为0.0003。
训练时间定为1000，提前停止耐心设定为50。

说明：对于所有训练的模型，只选择在验证集上得分最好的模型，并在测试集上进行评估。

5.5 评价指标

《MVGCN 人群流量预测模型笔记》

5.6 实验结果

《MVGCN 人群流量预测模型笔记》

实验证明： MVGCN在所有数据集上表现最好（除了MAE在出租车NYC）。

5.7 Results on sudden changes

图7给出MVGCN与五条基线在突发变化情况下的比较，这可能是由异常天气或交通事件引起的。计算所有区域每个时隙t与t-1的交通流量差；将所有交通流差绝对值按降序排序，并将前5%时隙定义为发生突然变化的时间点，剩余95%时隙为正常情况。实验表明：MVGCN大大优于所有其他方法，特别是在出租车TaxiBJ。

《MVGCN 人群流量预测模型笔记》

如图8所示， MVGCN模型在正常情况和突然变化方面都比其方法表现得更好，此外，在后者取得明显改进。原因可能是MVGCN有效地建模天气数据。

《MVGCN 人群流量预测模型笔记》

5.8 Results on multi-step prediction
图9给出了基于RMSE和MAE的多步预测结果。对于单步预测模型，MVGCN，我们为不同的时间步骤训练不同的模型。
对于包括FC-LSTM和DCRNN在内的多步预测模型，使用前6个时间步长作为输入序列，接下来的6次作为目标序列，训练模特。步数从1到6MVGCN 是鲁棒的，RMSE和MAE都有小的增加，在所有6时间步长中都达到了最佳效果。
随着时间步的增加，原始GCN是不稳健的。这表明如果我们以简单的方式将现有的模型应用于人群流量预测，它就不起作用。DCRNN表现不太好，因为它也只使用最近的时间步中的序列，导致它无法捕获周期、趋势和外部因素。

《MVGCN 人群流量预测模型笔记》

5.9 Effects of Different Components
图10展示了基于RMSE和MAE的不同时间视图组合的不同实验效果，包括最近（视图1)、每日(视图2)、每周(视图3)、每月(视图4）、季度视图（视图5）。只要考虑最近的观点，就会得到一个糟糕的结果当考虑到日视图时，结果得到了很大改善，表明周期性是交通流模式的重要特征。此外，随着更多的时间视力图的考虑，结果变得越来越好。

《MVGCN 人群流量预测模型笔记》
5.10 Geospatial position
没有地理空间信息，卷积层被降级为普通图卷积。表4显示：没有地理空间位置，RMSE从23.15增加到23.64，MAE也变得更差，证明了空间图卷积的有效性。

《MVGCN 人群流量预测模型笔记》

5.11 Global information

论文比较了MVGCN在两种设置下的性能：去除外部因素或元数据，如表4所示。通过消除外部因素，RMSE从23.15增加到24.41。同样，没有元数据，RMSE增加到23.23。结果表明，外部因素/Meta数据影响STG的预测。

5.12 Huber loss and number of GCN layers

为了进一步研究不同损失函数和GCN层数的影响。论文进行了一些消融研究，并报告了在TaxiNYC数据集上，不同空间图卷积层或损失函数的实验结果。

图11显示，使用RMSE、MAE或Huber作为损失函数的性能首先下降，然后随着GCN层数量的增加而增加。当GCN层数为5时，会出现最佳结果。

图11表明，深网络产生了更好的结果，但更深的网络仍然造成了共同的问题较高的预测误差。早期停止的训练时间随模型深度的增加而增加。

《MVGCN 人群流量预测模型笔记》

为了验证残差GCN层的影响，论文将有残差的GCN单元与无残差的普通GCN层比较。，没有剩余连接。

图12显示，两者在浅层网络中的表现相似。但当GCN的数量增加到5，残差网络可以获得更好的结果，并且它们都比浅层网络在适当的深度设置时表现得更好。

《MVGCN 人群流量预测模型笔记》

6. CROWD FLOW FORECASTING SYSTEM IN IRREGULAR REGIONS

论文作者在内部开发了一个可以访问的不规则区域的人群流量预测演示（称为城市流量）

图13(a)显示了系统中某个区域的流入和流出结果，其中绿线表示过去14小时的地面真实流入或流出，蓝色线表示14小时内的预测结果，橙色线表示未来10小时内的预测值。

可以看到，绿色和蓝色线条有非常接近的值和相似趋势，这意味着MVGCN可以在交通流量预测系统中有效和良好地工作。

图13(b)显示了整个城市不同时间戳的总体流量变化的另一个函数视图。在早晨的高峰时间，大多数地区有更大的人群流动，因为人们从家里出发，而在下午，大多数人在工作或休息。

《MVGCN 人群流量预测模型笔记》

推荐阅读

less
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
get
稀疏直接法视觉里程计中的特征点优化：基于光度误差最小化的灰度图像线性插值技术

在稀疏直接法视觉里程计中，通过优化特征点并采用基于光度误差最小化的灰度图像线性插值技术，提高了定位精度。该方法通过对空间点的非齐次和齐次表示进行处理，利用RGB-D传感器获取的3D坐标信息，在两帧图像之间实现精确匹配，有效减少了光度误差，提升了系统的鲁棒性和稳定性。 ... [详细]

蜡笔小新 2024-10-31 13:24:59
get
语义、实例与全景分割的对比分析（Comparative Analysis of Semantic, Instance, and Panoptic Segmentation）

图像分割技术在人工智能领域中扮演着关键角色，其中语义分割、实例分割和全景分割是三种主要的方法。本文对这三种分割技术进行了详细的对比分析，探讨了它们在不同应用场景中的优缺点和适用范围，为研究人员和从业者提供了有价值的参考。 ... [详细]

蜡笔小新 2024-10-29 18:51:14
get
超分辨率技术的全球研究进展与应用现状综述

本文综述了图像超分辨率（Super-Resolution, SR）技术在全球范围内的最新研究进展及其应用现状。超分辨率技术旨在从单幅或多幅低分辨率（Low-Resolution, LR）图像中恢复出高质量的高分辨率（High-Resolution, HR）图像。该技术在遥感、医疗成像、视频处理等多个领域展现出广泛的应用前景。文章详细分析了当前主流的超分辨率算法，包括基于传统方法和深度学习的方法，并探讨了其在实际应用中的优缺点及未来发展方向。 ... [详细]

蜡笔小新 2024-10-31 15:10:48
get
深入解析NoSQL数据库：键值对、文档、列式存储与图数据库的应用与特点

本文深入探讨了NoSQL数据库的四大主要类型：键值对存储、文档存储、列式存储和图数据库。NoSQL（Not Only SQL）是指一系列非关系型数据库系统，它们不依赖于固定模式的数据存储方式，能够灵活处理大规模、高并发的数据需求。键值对存储适用于简单的数据结构；文档存储支持复杂的数据对象；列式存储优化了大数据量的读写性能；而图数据库则擅长处理复杂的关系网络。每种类型的NoSQL数据库都有其独特的优势和应用场景，本文将详细分析它们的特点及应用实例。 ... [详细]

蜡笔小新 2024-11-09 14:47:28
less
POJ 2482 星空中的星星：利用线段树与扫描线算法解决

在《POJ 2482 星空中的星星》问题中，通过运用线段树和扫描线算法，可以高效地解决星星在窗口内的计数问题。该方法不仅能够快速处理大规模数据，还能确保时间复杂度的最优性，适用于各种复杂的星空模拟场景。 ... [详细]

蜡笔小新 2024-11-09 12:09:08
filter
深入理解 JavaScript 函数式编程技巧与应用（下篇）

本文将继续探讨 JavaScript 函数式编程的高级技巧及其实际应用。通过一个具体的寻路算法示例，我们将深入分析如何利用函数式编程的思想解决复杂问题。示例中，节点之间的连线代表路径，连线上的数字表示两点间的距离。我们将详细讲解如何通过递归和高阶函数等技术实现高效的寻路算法。 ... [详细]

蜡笔小新 2024-11-08 19:44:31
blob
C++ 开发实战：实用技巧与经验分享

C++ 开发实战：实用技巧与经验分享 ... [详细]

蜡笔小新 2024-11-07 20:31:03
get
单链表的高效遍历及性能优化策略

本文探讨了单链表的高效遍历方法及其性能优化策略。在单链表的数据结构中，插入操作的时间复杂度为O(n)，而遍历操作的时间复杂度为O(n^2)。通过在 `LinkList.h` 和 `main.cpp` 文件中对单链表进行封装，我们实现了创建和销毁功能的优化，提高了单链表的使用效率。此外，文章还介绍了几种常见的优化技术，如缓存节点指针和批量处理，以进一步提升遍历性能。 ... [详细]

蜡笔小新 2024-11-07 15:55:20
get
深入解析Java 8并发编程：AtomicInteger源码详解与应用分析

本文深入解析了Java 8并发编程中的`AtomicInteger`类，详细探讨了其源码实现和应用场景。`AtomicInteger`通过硬件级别的原子操作，确保了整型变量在多线程环境下的安全性和高效性，避免了传统加锁方式带来的性能开销。文章不仅剖析了`AtomicInteger`的内部机制，还结合实际案例展示了其在并发编程中的优势和使用技巧。 ... [详细]

蜡笔小新 2024-11-06 19:11:47
get
SRM 553：深入解析供应链管理系统的最新进展与应用

SRM 553：深入解析供应链管理系统的最新进展与应用本文详细探讨了供应链管理系统（SCM）的最新发展及其在实际应用中的影响。通过对当前技术趋势的分析，文章揭示了 SCM 在提高效率、降低成本和增强透明度方面的关键作用。此外，还介绍了几种创新的 SCM 解决方案，如区块链技术和人工智能的应用，以及这些技术如何帮助企业更好地应对市场变化和挑战。 ... [详细]

蜡笔小新 2024-11-05 22:15:09
get
当前物联网领域十大核心技术解析：涵盖哪些关键技术？

经过近十年的技术革新，物联网已悄然渗透到日常生活中，对社会产生了深远影响。本文将详细解析当前物联网领域的十大核心关键技术，包括但不限于：1. 军事物联网技术，该技术通过先进的感知设备实现战场环境的实时监测与数据传输，提升作战效能和决策效率。其他关键技术还包括传感器网络、边缘计算、大数据分析等，这些技术共同推动了物联网的快速发展和广泛应用。 ... [详细]

蜡笔小新 2024-11-05 19:25:03
get
TypeScript 实战分享：Google 工程师深度解析 TypeScript 开发经验与心得

TypeScript 实战分享：Google 工程师深度解析 TypeScript 开发经验与心得 ... [详细]

蜡笔小新 2024-11-04 12:55:23
get
155225266，环（丙氨酸丝氨酸），(S)-3-羟甲基-1-甲基哌嗪-2,5-二酮

英文名称：环（丙氨酸-丝氨酸），(S)-3-羟甲基-1-甲基哌嗪-2,5-二酮。该化合物是一种具有独特环状结构的氨基酸衍生物，其分子中包含一个手性中心，表现出显著的立体化学特性。这种化合物在有机合成和药物化学领域具有潜在应用价值，特别是在开发新型生物活性分子方面。 ... [详细]

蜡笔小新 2024-10-31 18:49:54
get
视觉图像的生成机制与英文术语解析

近期，Google Brain、牛津大学和清华大学等多家研究机构相继发布了关于多层感知机（MLP）在视觉图像分类中的应用成果。这些研究深入探讨了MLP在视觉任务中的工作机制，并解析了相关技术术语，为理解视觉图像生成提供了新的视角和方法。 ... [详细]

蜡笔小新 2024-10-30 09:47:50

雪狱冰魂_520

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章