基于深度学习的部分可观测性下城市轨道交通短期OD客流预测

 1.文章信息

本次介绍的文章是2022年发表在神经计算与应用(2019)的《Deep learning for short-term origin–destination passenger flow prediction under partial observability in urban railway systems》。

2.摘要

摘要短期OD流预测是城市轨道交通运营规划、控制和管理的重要内容。虽然出入境旅客需求预测问题已经在各种研究中得到了研究,但OD客流预测问题受到的关注要少得多。短期OD流量预测的一个关键挑战是由于出行没有在一定的时间间隔内完成,OD流量信息的部分可观测性。本文开发了一种用于城市轨道交通系统OD流量预测的新型深度学习架构,并研究了数据表示和处理部分信息的各种机制。深度学习框架由三个主要组成部分组成,包括多个LSTM网络,该网络具有捕获短期/长期时间依赖性的注意机制,用于时空相关性的时间移位图矩阵,以及用于部分OD流观测的重建机制。该模型使用香港地铁系统的智能卡数据进行验证,并与最先进的预测模型进行了比较。实验旨在检验所提出的方法及其各个组成部分的特性。结果表明,所提出的模型具有较高的精度和鲁棒性,以及OD流量信息的局部观测对提高预测性能的重要性。在数据表示方面,预测OD流量偏差的效果始终优于直接预测OD流量。

3.介绍

当乘客提出出行请求时,可直接观察到网约车服务实时完整的OD客流信息。然而,在公共交通中,乘客在起点处刷卡,只有到达目的地时才能看到目的地信息。短期OD流量预测面临的另一个挑战是不同外径对之间的滞后时间相关性建模,这在文献中尚未得到充分研究。即目标OD对的客流可能会受到邻近或遥远的不同进入时间的OD对的客流的影响。在实时预测模型中,对不同滞后时间相关性进行建模是有效获取时空相关性的关键。

本文研究了城市轨道交通系统中OD客流的实时预测问题。提出了一种新的深度学习结构,称为时间位移时空网络(TS-STN)。它由三个模块组成,分别捕获预测中的空间、时间和实时信息:1)空间模块使用具有时间位移图矩阵的图卷积模型对OD对之间的空间相关性进行建模;2)时域模块使用基于注意的LSTM网络学习OD流的短期/长期依赖关系。针对不同OD对设计了特定的密集层,以捕获不同OD对的异质流依赖关系;3)实时信息模块设计了新颖的机制,以充分利用部分/完全观测到的实时信息,包括部分观测到的OD流量和完全观测到的进入需求,直到做出预测。主要贡献有:

•提出了一种新的基于部分可观察性的短期OD客流预测深度学习方法。它获取了OD流量的时空相关性和实时OD流量观测的部分信息。

•提出了一种具有时间位移图矩阵的图卷积模型,以明确地捕获OD流之间的异构时空依赖关系。

•使用来自城市铁路系统的经验数据和系统实验来验证该方法,以评估其预测性能作为数据表示(输入/输出)、建模技术(模块函数)和信息可用性的函数。

4.模型建立

1.问题定义

本研究的问题是对城市轨道交通系统的短期OD客流进行预测。考虑有N个OD对的城域网络,OD对  的流量时间步长t,记为  ,是时刻t从起点站  出发到终点站  的出行次数。  ={  }表示对i在时间上的OD流(例如从时间步骤1到t)。  ={  }为所有N个OD对在第t个时间步长的流量。在时间区间t,网络层面的短期OD流量预测的任务是预测OD流量{  },为了将来  ≥1个时间段,给定观察到的历史和实时OD流量,直到时间间隔t。观测值可以包括之前时间段以及前几天的OD流量。我们称这个问题为  步提前预测。注意,对于OD流量预测,一个挑战是信息的可观测性水平  是不同的,因为不同的OD对旅行时间不同。另一个挑战是建模不同外径对之间的滞后时间依赖性。

2.方法

在本节中,我们详细阐述了提出的用于多步、短期OD流量预测问题的时间位移时空网络(TS-STN)的总体框架。图3显示了TS-STN体系结构。它由三个主要模块组成,捕捉OD流量随时间(间隔、天、周)和空间的时空依赖性:

·空间模块:它使用时间移图卷积(TSGC)模型来捕获OD对之间的空间相关性。在时间步t,取{  }和时序移位图矩阵作为信息的输入,并将输出输入时序模块中的区间LSTM。

·时间模块:它由三个LSTM模型组成,即间隔LSTM /日LSTM /周LSTM。它们分别用于模拟目标预测间隔与之前时间间隔之间,以及在前几天/周的相同间隔内的时间依赖性。开发了一种注意机制来学习每日和每周的相似性,它捕获最相关的长期信息用于预测,并遵从OD对的时间依赖异质性。具体来说,时间注意机制从日/周LSTM中获取历史隐藏状态向量的输入,从间隔LSTM中获取当前隐藏状态向量的输入。它输出每日和每周上下文向量。

·实时信息模块:利用完全观测到的进站需求和部分观测到的OD流量两类实时信息。输出为利用车站入口需求和历史分配矩阵估计的OD流量矩阵,以及利用部分观测到的OD流量重建的OD流量。

最后,对于不同的OD对组,具有独立参数的全连通密集层分别输入实时估计/构建的OD流量、区间LSTM的目标隐藏状态和日/周上下文向量,并输出OD流量预测。在多步预测的情况下,使用之前的历史步骤和最近预测的OD流量来预测后续步骤的OD流量。

a3a482b6a4222cab68cefd1dcbad92cb.png

2.1 时移图卷积

现有的方法存在一些缺点,比如,与图中可以看作节点的站点或区域不同,为OD对构造合适的邻接矩阵并不简单,而且更具挑战性。这是因为每个OD对由两个站组成;基于网络拓扑特性很难反映OD对之间的连通性。其次,使用文献中提出的相关矩阵没有捕获OD对之间的滞后时间相关性。为了克服这个问题,我们提出了一种时间移位图卷积(TSGC)。我们首先引入一个时间位移相关矩阵  。城域网络被定义为一个有N个节点的图G,代表N个OD对。假设我们有两个长度相等的时间序列观测值  和  ,分别表示对i和对j的历史OD需求。那么,对i和对j具有时滞s的时移相关性表达式为:

1f2cb28131d39a17e5565c1e1131fc2a.jpeg

其中,cov(·,·)是两个向量之间的协方差,var(·)是向量的方差,  为滞后s个时间间隔的时间序列  。包含相关性较弱的区域/对可能会降低预测性能。因此,我们通过滤波矩阵单元,建立了修正的时间位移相关矩阵  ,   为修正的相关矩阵。具体来说,对于交叉相关性较弱的对(例如,值小于  中的行平均交叉相关性值),我们将  赋值为0。

在时刻t,捕获t和区间t-s之间的时空相关性采用修正的时移相关矩阵  ,一个多层TSGC将  和所有N对在t-s时刻的OD流作为输入,输出特征矩阵  ,可以写成公式3。  为添加自连接后的修正时移相关矩阵。  是  的度矩阵,  是TSGC模型中要训练的层特定权重矩阵。考虑s个滞后区间与时间t之间的依赖关系,对  进行TSGC运算根据式(3),输出特征矩阵{  }。最后,由式(4)通过融合运算U(例如,average, max, sum)得到t处所有n对的最终输出特征矩阵  与  连接,并在时间t时馈入时态模块。

b7ca12038b076e00c76985cbd9233f66.png

2.2带有时间注意的LSTMs

我们应用LSTM来模拟OD流与最近时间间隔的依赖关系,称为Interval-LSTM (ILSTM)。此外,长期的时间模式(例如,每日/每周相似性)可以提高预测性能。用长序列训练LSTM具有挑战性。它增加了梯度消失的风险,从而显著削弱了学习周期性的效果。为了解决这个问题,我们进一步设计了两个LSTM,即Daily-LSTM (DLSTM)和Weekly-LSTM (WLSTM),如式(6b) - (6c)所示,来学习长期的时间依赖关系。为了获取日相似性,对于第k天,OD在相同的时间间隔t内来自前p天,记为[  ]被送入DLSTM。类似地,OD来自前q周在区间t中的同一天,记为  作为WLSTM的输入,以捕获每周的模式。

b2b3a2f6259f27e0469e8bac1c3ac5c5.png

时间注意机制进一步采用时间注意机制,提高了预测精度。首先,它利用了来自前几天/几周的预测间隔的更多历史隐藏状态,而不是纯粹依赖于DLSTM和WLSTM最后一步的隐藏状态。其次,通过在不同水平上对相关区间分配不同的权重,能够学习长期的时间异质性。

2.3部分OD流量信息

地铁系统OD流量预测的一个关键难点在于近期区间(如区间t, t-1,…)由于不完全出行而无法观测。直观上,融入更多模型中不同来源的信息有利于预测性能的提高。两种类型的信息可以帮助实时完成未观察到的OD流量信息。

•通过利用前一段无法获得完整OD流量的进站需求,我们根据OD流量与进站需求的平均比率估算OD流量  。

•最近一些井段可以部分观测到外径流量,例如,当一些下钻在井段开始时就已经完成,这可以用来外推整个井段的外径流量  。

估计的OD流量和部分OD流量都通过完全连接层进行转换,并集成到我们的模型结构中。算法1演示了所提出的ST-TSN模型的主要过程。

a47f668504889feb5d1c06456d3cb125.png

5.实验结果与分析

1.数据集描述

本研究使用香港地下铁路系统的智能卡数据。地铁网络由10条重轨线、163个车站、一条轻铁网络和接驳巴士服务组成。截至2019年底,重型铁路平均每天运送旅客约468万人次。AFC系统是封闭的,在进出地点都有交易记录,从而给出一次旅行的完整记录。数据集来自2018年4月9日至6月24日的AFC系统。将原始数据预处理成15分钟粒度的OD矩阵。最后两周的数据作为测试集,其余几天作为训练集。另外,选取了12对具有不同特征的典型OD对进行实验。所选的12个OD对在需求水平和行驶距离上各不相同,包括直接和换乘行程(见图4)。

c37b46d3aecc445c7d7bd8abe90262c3.png

使用平均绝对误差(MAE)和均方根误差(RMSE)来评估模型性能,见式(8a) - (8b)。

2af70bda59fc1082caafb9984148e731.png

2.模型开发

最终的预测模型。在模型开发过程中考虑了四个组件,即输入/输出表示、时间模块、空间模块和实时信息模块。

•对于输入/输出表示,我们测试了绝对值的性能,原点站入口需求的分布分数,以及OD流量的偏差。

•对于时间模块,预测区间和同一天的历史区间之间的短期和长期时间依赖关系,考虑前几天/几周。

•对于空间模块,测试了三种不同的邻接矩阵构造方法,包括相关矩阵、修正相关矩阵和时间移位相关矩阵。

•对于实时信息模块,我们考虑了两种信息,包括估计OD流量和部分观测OD流量。

为了找到模型输入/输出的最佳表示,我们选择一个基本模型来开始这个过程。基本模型将OD流视为时间序列,并使用LSTM对时间相关性进行建模。请注意,我们没有使用传统版本的LSTM,而是开发了一个具有独立密集层的基于注意力的LSTM (ALSTMs-SL)来建模时间依赖性。在ALSTMs-SL中,使用与前几天/前几周相同时间间隔的每日/每周LSTM以获取长期信息。选择相同时间间隔的动机是,由于旅行者的习惯性活动和旅行选择,客流通常具有明显的周期性(每日/每周)模式。时间注意机制用于更加强调最相关的时间步骤。在预测中,不同OD对的致密层分离对于捕捉外径流动的独特特征和异质贡献非常重要。

3.模型比较

将提出的模型与文献中的基准模型进行比较,包括经典统计方法、最先进的机器学习和深度学习模型。表7显示了所提模型和基准模型在测试数据集上提前15分钟、30分钟和45分钟预测的结果。该方法在所有预测区间内均获得了最低的MAE和RMSE。

b1e67560b9ed9b58d7be083da8396ce0.png

表8给出了ANN、LSTM、Seq2Seq-Att模型在个人计算机(Intel(R) Xeon(R) Silver 4114 CPU @ 2.20 GHz)上的训练和预测时间。在训练阶段,由于空间和实时信息模块,提出的TS-STN运行速度比其他三种模型慢。对于预测,报告测试集的总时间成本。TS-STN模型虽然计算时间较长,但在实际应用中是可以接受的。

927636e7a201e50254b2beb94be04bf2.png

4.敏感性分析

提出的模型(TS-STN)通过向网络中添加时间、空间和实时信息组件,按顺序建立。由于深度学习模块之间的复杂交互,它可能不是最优的。因此,在本小节中,我们进行了敏感性分析,以验证所提出模型的可靠性和鲁棒性。在接下来的实验中,采用所建立的TS-STN作为基础模型。我们通过更改单个组件设置来检查许多变体。为了便于讨论,“T”、“S”和“P”分别代表时间、空间和实时部分信息模块。

表9总结了提出的TS-STN的多种变体的结果。结果支持使用OD流量偏差代替绝对值作为模型输入/输出的有效性。表9还显示了不同的设置对预测性能的影响。与空间模块中的修改相比,改变时间模块中的设置对模型性能的影响更大。

9a49438e2e2d9a6b2151897a602effc8.png

6.结论

短期OD流量预测适用于各种运输应用。本文建立了基于深度学习的模型,用于预测城市轨道交通系统局部可观测性下的短期OD流量。它还系统地研究了深度学习模型组件的各种机制,包括数据表示、时空相关性和部分观测。提出了一种新的深度学习体系结构(TS-STN)。该方法利用基于注意的LSTM网络和具有时间位移相关图矩阵的图卷积网络,将时间和空间模块集成在一起。此外,部分观测到的OD流(由于预测时不完全出行)也被纳入模型架构中。个案研究使用智能卡数据从繁忙的城市铁路系统进行。结果证实,与现有的预测模型相比,所提出的模型在具有不同特征的OD对的单步和多步预测方面具有优越的性能(准确性和鲁棒性)。实证研究表明,使用OD流量偏离平均值的方法比直接预测OD流量(这是文献中常见的做法)效果要好得多。在设计深度学习结构时,考虑与时间滞后的时空相关性,并充分利用部分观测到的OD流信息来提高预测性能是很重要的。未来研究的有趣方向包括整合来自多个来源的数据(如社交媒体、气象学),特别是在异常条件下(如不利天气、特殊事件)的需求预测,以及使用流数据进行在线预测,以识别数据缺失、噪声和延迟观测的可能问题。

Attention

欢迎关注微信公众号《当交通遇上机器学习》!如果你和我一样是轨道交通、道路交通、城市规划相关领域的,也可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

猜你喜欢

转载自blog.csdn.net/zuiyishihefang/article/details/129742668
今日推荐