将运动波理论纳入高分辨率交通速度估计的深度学习方法

 1.文章信息

本次介绍的文章于2022年发表在IEEE Open Journal of Intelligent Transportation Systems期刊,名为《Incorporating Kinematic Wave Theory Into a Deep Learning Method for High-Resolution Traffic Speed Estimation》,该文章将运动波理论与深度学习结合来估计道路交通速度。

 2.摘要

本文提出了一种基于运动波的深度卷积神经网络(Deep CNN),通过稀疏探测器车辆轨迹来估计高分辨率的交通速度场。我们引入了两个关键方法,使我们能够将运动波理论原理融入到现有的基于学习的估计方法中,从而提高其鲁棒性。首先,我们为深度CNN提出了一个各向异性的交通核。各向异性核可以明确地考虑宏观交通中的时空相关性,并有效地减少深度CNN模型中的可训练参数数量。其次,我们建议使用模拟数据来训练深度CNN。使用针对性的模拟数据进行训练可以隐式地为学习模型施加理想的交通物理特征。在实验中,我们强调了使用各向异性核的优势,并使用下一代仿真(NGSIM)和德国高速公路无人机(HighD)数据集评估训练模型在实际交通中的可迁移性。结果表明,各向异性核显著降低了模型复杂性和过拟合,并提高了估计速度场的物理正确性。我们发现,对于各向异性核,模型复杂度与问题规模呈线性关系,而对于各向同性核,模型复杂度与问题规模呈二次关系。此外,在实际数据集上的评估表明本文方法具有良好的性能,证明了基于仿真的训练是一种可行的替代实际数据的学习方法。最后,与其它估计交通速度方法的比较表明,所提出的方法具有更高的估计准确性。

总体来说,本文的贡献是:

1)根据交通流的波传播特性,我们开发了一种各向异性的CNN卷积核设计。这可以应用于交通状态估计、预测和数据插补。我们还提出了一个优化程序来学习各向异性核的最优权重。

2)我们建议使用模拟交通数据来拟合各向异性Deep CNN模型,并在真实世界的数据集上测试其性能。

3)我们演示了使用各向异性Deep CNN模型在精细时空分辨率(在我们的实验中为10米×1秒)下使用有限的探测车轨迹(5%)进行速度场估计。我们展示了来自多个来源的真实世界交通数据的样本估计。

4)通过引入Deep CNN模型的集成版本,扩展了我们的估计方法,以处理未知数量的探测车轨迹。

3.估计方法

A. 问题定义

将给定路段的时空域D = X×T离散为均匀段x⊂X和时间间隔t⊂T,设V(x, t)表示单元(x, t)∈D中宏观速度场的值。我们使用更接近车辆长度的单元大小|x|和以秒为单位的|t|来实现高分辨率速度场估计。探测车(PV)为D中的一些单元提供局部速度测量60b91b9466795e017ad2bae4cfeb9e07.png,我们用张量zp来表示这个部分信息。我们假设稀疏观测设置,其中zp中只有少数单元(例如5-10%)具有速度信息。我们用zf表示整个时空域D的完整速度场V(x,t)的估计张量。估计问题可以正式表示为学习映射函数g: zp→zf。

使用三维RGB阵列(分布域{1,…,255})而不是一维速度值来编码输入张量zp的每个单元中的速度V(x, t)。这是为了区分静止车辆占据的单元(即V(x, t)=0)和没有车辆的单元。输出张量zf表示域D上的完整宏观速度场,并且可以使用一维速度值进行编码。因此,我们有,zp{1,…,255}|X|×|T|×3zf|X| |×| |T|0

B. 用于估计的深度卷积神经网络(Deep CNN)模型

我们使用深度CNN模型来表示映射函数g,模型架构如下图所示,包括一个编码器genc和一个解码器gdec,每一个都由三个CNN层组成。深度CNN模型获取输入zp,使其通过分层卷积层,并输出估计的速度场zf

1493975482242b423de074fe80422b82.png

在CNN中使用局部核的离散卷积形成了交通速度场估计的基础。在给定的CNN层l中,通过卷积运算,即l-1层与(x, t)相邻单元(xj,tj)的加权和来计算(x, t)中的特征值,如下式所示:

79d4c44bb758edc52434d994206a22aa.png

其中2abee0fcb915bf4c3744ee9e0d2bbc7e.png是与单元(x, t)和颜色通道2d1da2586b94b90d433e7e59c7ad1614.png∈{1, 2, 3}相关的层l中的特征图值,881e4d86d8494ef6a20e1e7099a76e0d.pngad75fc66c531a63751e139835f7dedfb.png是核(矩阵),这对于所有单元都是相同的。f8309107d461cdbb71a94955f57e3978.png是核矩阵的一个元素,确定相邻单元(xj,tj)Iiso与主题单元(x, t)相关的程度。

单元(x, t)中的特征图值可以被认为等效于该单元中的速度场V(x, t)(或与速度场相关的函数)。上述公式简单地说:单元(x, t)中的速度是在其紧邻的周围单元中观察到的速度的加权插值。局部单元影响的程度Iiso在图2(a)中的时空平面上直观地描述。层l中的每个内核表示不同的加权函数,内核一起学习识别不同的流量特征。

e0baa5f919add3b86c46bbd0fb7bc7aa.png

C.深度CNN的各向异性内核设计

如图2(a)所示的各向同性核表明,单元(x, t)中的速度与阴影矩形区域Iiso中任何地方观察到的速度相关。这假设在(xt)处的速度变化(例如由减速或加速引起的速度变化)可以在时空平面中以无限的速度传播。然而,在实际流量中却并非如此。在实际交通中,(i)速度或密度变化以小于或等于自由流动车辆速度的有限速度传播,以及(ii)车辆(主要)对前方刺激做出延迟反应(大约等于驾驶员的反应时间)。前者被称为双曲性,后者被称为各向异性。双曲性是交通流模型中各向异性的必要条件。局部核的使用(即核维度为时空平面的维度)捕获了双曲性特性,而各向异性可以通过如下所述修改核形状来捕获。

速度变化的实际传播速度取决于交通状态(即速度或密度)。我们假设时空平面中任何一点的交通要么处于自由流动状态,要么相对于基本图处于拥堵状态。存在分别与自由流和拥堵相关联的不同交通状况。然后,单元(xt)中的速度变化在自由流动情况下正向传播,而在拥堵情况下反向传播。这是交通的一个经验和理论上确立的特征。因此,与单元(xt)相关的时空平面的程度取决于交通状态是自由流还是拥堵。各相关区域如图2(b)和图2(c)所示,分别为阴影区域IfreeIcong

单元(x, t)中的速度影响下游区域Ifree和上游区域Icong。同样地,上游区域Ifree和下游区域Icong影响单元(x, t)中的速度。总之,单元(xt)中预测的速度与IfreeIcong中任何地方观察到的速度相关。

我们使用这种时空相关性的知识为图1中的深度CNN模型设计一个替代的因果校正内核(在流量意义上),我们将其称为各向异性核,并用张量fbbcc7f643271e455eb5bea12789f921.png表示。相应的卷积运算略微修改为下式,其中有效影响区域定义为e6afe374c253fd6e3bdd0284516f868d.png

4f6afff80610fd30fc535f92f6e46fca.png

在本文中,我们提出了一种特定的各向异性核设计,其影响区域受到进一步限制,其动机是经验观察:(i)拥堵的交通具有非常窄的波传播速度范围(因此它们可以被视为几乎恒定),以及(ii)自由流交通波传播速度被限制在最大和最小期望车速范围内。取代各向同性内核的各向异性内核设计如图3所示。我们创建了两个内核,每个内核用于自由流动和拥塞的流量。影响区域Ifree包含最大(cvmax)和最小(cvmin)期望车辆速度之间定界的所有单元。这对于期望的速度分布具有宽范围的异构交通来说是合理的。自由流流量内核如图3(a)所示。拥堵交通的影响区域Icong仅包含通过向后传播的冲击波速度cw的那些单元,见图3(b)。所提出的各向异性核是自由流和拥塞核的叠加,如图3(c)所示。图3(d)用于比较,可以看出,对于7×7卷积核,各向异性内核所需的参数比各向同性内核少50%,所提出的各向异性内核设计的一个实际好处是显著降低了深度CNN模型的模型复杂性。

c4e7d3c7548e9b39e0ae69d337636085.png

D.学习各向异性核

我们在图1中的深度CNN模型的所有层中使用各向异性核,各向异性核的最优权重529ccaa8aa63dda2321f0c015820b430.png是从以下约束优化问题中获得的:

01f36bd71b42ab85ae6948e8b3cad6e7.png

其中22175269c026281ea7db9777c83389d0.png是映射函数(即深度CNN),1ani是与各向异性核影响区域Iani,即图3(c)阴影区域相对应的单元的值为0,其余单元值为1的二维张量,这样做的目的是保证各向异性核影响区域以外的值为0,即图3(c)空白区域的值为0,相当于不参与卷积运算。损失函数141ee4fd70563b6cb88a771b1069221a.png计算估计速度场和真实速度场之间的差异,例如,平方误差:

00e921462299a0af51503bfbf6bacd1f.png

约束优化问题(3)可以使用迭代方案来解决,该迭代方案可以处理可行性约束,例如投影梯度下降。在每次迭代i中,更新计算如下:

c271e78068c1a9cb9546623f40a7c265.png

其中1fb4cff9a6f647be6e75cb9c19b79970.png是迭代i中的步长(或学习率),G是下降方向。算子PIani将零分配给对应于Iani之外的单元,从而确保了解的可行性。

4.数据和训练

如前所述,我们使用由不同交通条件组成的模拟交通数据来训练各向异性Deep CNN模型。在下文中,我们描述了用于训练和评估模型的数据。

A.训练数据生成

为了生成用于训练CNN模型的数据,我们使用Vissim微观交通模拟器模拟高速公路路段。模拟路段对应阿联酋阿布扎比-艾因E-22公路(长2英里,宽3车道),我们在高速公路路段模拟了三种不同数量的输入车辆需求情景:800-1200辆/小时、2400-3000辆/小时和4200-5400辆/小时。我们使用这些需求曲线来复制模拟高速公路上不同的交通条件,即自由流动、缓慢行驶(中度拥堵)和(严重)拥堵的交通。

a6b2df12204f00539dc7cddb2386830d.png

46da6c671987e45ee4100f3cd2957203.png         

图5(a)显示了三种模拟交通场景下车辆轨迹的300秒快照,各向异性核是根据这些图中所见的波传播速度范围设计的。图5(b)是三种情况下的流量密度散点图。这些数据一起显示了训练数据中包含的交通状态的丰富性。

B.定义宏观速度场

一项重要的辅助任务是定义“真实”速度场,深度CNN模型将其用作评估估计质量的“地面实况”。这是通过将所有车辆轨迹(而不仅仅是PV)的集合转换为速度场V(x, t)来实现的。由于我们使用的精细网格尺寸,通常使用的宏观速度的广义定义导致一些单元的V(x, t)=0。因此,我们提出了一种简单的插值方法。我们的方法根据以下公式在固定时间对道路单元上的速度进行插值,公式详解参见论文,这里不再赘述。

915514a8f13c50a2524608d443be36a3.png

C.训练过程

每个场景的模拟输出是三条车道中每条车道7200秒的轨迹数据。我们首先将单个车道的轨迹映射到时空平面上,以形成尺寸为80×7200的输入和输出帧(即网格大小为10 m×1s)。使用5%的采样率随机选择输入帧的PV轨迹。使用上式中描述的插值程序生成形成地面实况速度场的输出帧。然后,我们使用80×60的滑动窗口分别从输入帧和输出帧中提取输入张量(zp)和输出张量(zf)的样本。我们使用滑动窗口之间的2s空间间隙为每个轨迹数据集生成6000+个样本。我们以类似的方式,使用5%的采样率,为三种流量场景中的每一种场景生成具有不同随机输入样本集的更多数据。最终的增强数据集具有64000+个输入输出样本对,用于训练深度CNN模型。

D.测试数据

我们使用三个数据集测试了我们的模型:(i)未用于训练的模拟数据(来自高速公路路段的不同车道),(ii)NGSIM数据集,以及(iii)德国公路无人机(HighD)数据集。需要强调的是,我们不使用NGSIM或HighD数据集来训练模型。换句话说,该模型是使用阿拉伯联合酋长国高速公路模拟的数据进行训练的;然后用来自同一模拟的额外数据以及来自美国高速公路和德国几条高速公路的真实数据进行测试。这使我们能够评估模型对训练集中没有的不同交通场景和动态的可转移性,以及使用模拟数据而不是真实数据进行训练的可行性。

5.结果和讨论

A. 各向异性CNN模型重建

图6显示了使用各向异性模型模拟测试数据集的五个样本估计速度场。重建窗口为800m×60s,分辨率为10m×1s。还显示了每个样本在三个时刻(t=10、30和50s)的真实速度场、PV轨迹和速度分布。其中三个样本对应于拥堵的交通状况,一个对应于缓慢行驶的交通状况和一个对应自由流动的交通状况。可以看出,各向异性核具有良好的重建效果。

726f79d60d0278034820746ed05ca0e9.png

6d53222234cc4b5cef4579205f4f95ed.png

B.各向异性和各向同性模型的比较

接下来,我们比较表II中各向异性和各向同性模型的性能和计算要求。表中所示的RMSE计算是4000多个模拟测试样本的样本平均值。总体而言,各向异性和各向同性模型在精度方面具有相似的性能,但各向异性模型导致了更具物理合理性的冲击波动力学。特别地,根据所需的速度分布,可以增加各向异性内核的范围(即cvmin和cvmax的值)并对其进行校正。

369c8105494e50a3a6ce0146ceeed27d.png

尽管各向同性和各向异性模型在估计速度的平均误差方面表现相当,但在一些例子中,它们在产生的冲击波的结构(速度和范围)方面有所不同(详见论文分析,这里不再赘述)。

C.真实世界交通动态的可转移性

为了了解各向异性CNN模型在交通特征与训练数据集中观察到的不同的场景中的表现,我们在不同的真实世界高速公路路段上进行了测试。图9-11显示了HighD和NGSIM数据集中三个样本高速公路路段的估计结果,使用的数据PV采样率为5%。

0c92fd9e53ab64581615344c3f13923a.png

98f65c5d36dc4d5e91c69ba34a812bfc.png

61ed75240d84098a61bec48e6c11c4a6.png

D.不同数量探测车轨迹数据

为了总结我们对CNN模型性能的评估,我们研究了改变PV渗透率的影响。我们使用数据训练了六个不同的模型,这些数据分别由特定的PV渗透率10%,20%,…,70%(除了本文中讨论的5%探针模型之外)组成。每个这些探针特定模型都使用具有相应PV渗透率的测试数据进行评估。平均测试RMSE结果如图13(a)所示(标记为“探针特定模型”)。如预期,随着PV渗透率的提高,RMSE会降低。

6f5a616e23007559b90dae84f0291ef8.png

6.总结

在本文中,我们通过提出一个各向异性的深度卷积神经网络(CNN)模型来估计高分辨率的交通速度场。该模型采用了各向异性的交通内核,旨在明确地捕捉宏观交通中广泛的前向和后向传播速度。此外,Deep CNN模型是使用模拟交通数据训练的。由于Deep CNN性能的泛化取决于训练数据的分布,我们注意到,使用有针对性的模拟数据是对估计模型施加理想的交通物理学的另一种方法。例如,我们生成对应于不同交通状况的数据(拥堵、缓慢移动、自由流动等),以便深度CNN可以学习源自异质的交通波传播速度。

在实验中,我们主要关注在Deep CNN模型中使用各向异性核比各向同性核具有更好的效果。我们发现,各向异性核降低了模型的复杂性,并且不容易出现过拟合,尽管估计误差与各向同性核相似。各向异性核的模型复杂度随问题大小线性增长,而各向同性核则呈二次增长。我们提供了具体的例子来证明各向异性核能更好地产生物理上正确的交通冲击波。我们在真实世界的交通数据集上进一步评估了各向异性的Deep CNN,并发现了可接受的转移性能。这表明模拟数据是训练深度CNN的真实世界数据的一个可行的替代物。我们还发现,深度CNN模型的性能取决于探测车渗透率,并提出了一个集合模型来处理未知的探测车渗透率。

我们相信,将深度学习技术应用于交通状态估计等特定领域的最佳方式是将该领域的基本原理融入到深度学习模型的框架中。本文只是这种方法的一个可能的例子。在未来的工作中,我们旨在探索其他方法,将交通流理论纳入深度学习模型。

Attention

欢迎关注微信公众号《当交通遇上机器学习》!如果你和我一样是轨道交通、道路交通、城市规划相关领域的,也可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!

猜你喜欢

转载自blog.csdn.net/zuiyishihefang/article/details/130592109
今日推荐