一、研究背景
随着各种软硬件平台的升级,各种交通大数据被保存下来,其中出租车轨迹数据就是城市中比较典型的、规模庞大的一类交通大数据
了解居民出行行为 降低城市交通管理成本 制定合理发展策略
理解用户出行行为 满足乘客出行需求 提升乘客满意度
同时以轨迹数据为基础的服务也带给我们许多便利。 网约车平台:智能派单 地图软件:提前规划最佳路线规避拥堵
近几年来一些基于深度学习的算法开始在出租车轨迹数据的应用领域崭露头角,特别是在出租车短时流量/需求预测、出行时间估计、组成派单优化等领域深度学习得到了广泛的应用
二、深度学习在出租车数据的主流研究方向
短时流量/需求预测
有关出租车短时流量、载客需求以及OD需求的预测可以分析客流的分布,从而提高服务水平,因为不同时段两个区域之间的需求量不仅承载着乘客需求的强度,还有利于挖掘有用的出行模式
目前基于深度学习的出租车短时流量/需求预测问题主要有两大类建模方案:
(1)通过卷积神经网络(CNN)从二维时空交通数据中获取空间相关性
ST-ResNet DMVST-Net STDN
(2)通过图卷积神经网络(GCN)从非欧式空间提取空间相关性信息
ST-MGCN GEML
出行时间估计
出行时间估计(Travel Time Estimation,TTE)任务是给定路线和出发时间,估计相应的出行时间,在导航、路线规划和叫车服务等智能交通系统中发挥着重要作用,可以极大程度帮助司机提前了解交通状况,制定行程计划
目前基于深度学习的出行时间估计方法主要有两大类:
(1)通过GPS轨迹点进行出行时间估计
DeepTTE DeepTravel
(2)通过匹配路网进行出行时间估计
ConSTGAT
出租车派单优化
近年来,Uber、滴滴等“按需”交通服务提供了一种全新的叫车方式,通过收集司机信息和乘客订单,并依靠一个集中的决策平台来匹配司机和订单,从而显著提高了服务效率
在滴滴最新工作中,深度学习开始被引入出租车派单系统的决策优化中。其主要思想是将订单分派表述为一个大规模的顺序决策问题,每个决策对应的是司机是否匹配订单的行为,这将使平台的长期收益最大化;该算法除了关注当前的状况(接单距离),还考虑了订单调度决策对未来的影响,以便在时空上平衡需求和供应的分配
三、出租车轨迹数据获取手段及相关开源数据集介绍
海口市出租车载客订单数据(滴滴盖亚计划开源数据集)
数据集开放了2017年5月1日 - 2017年10月31日之间海口市每天订单数据,包含起终点经纬度、订单类型、乘车人数等属性数据
获取网址为:https://outreach.didichuxing.com/app-vue/HaiKou?id=999
纽约市出租车载客订单数据
数据集开放了2013年和2014年的纽约市每天的出租车订单数据,包含行程ID、上车时间、上车经纬度、下车时间、下车经纬度、乘客数量以及行程持续时间等数据
获取网址为:http://chriswhong.com/open-data/foil_nyc_taxi/
北京市出租车流量数据 开放了北京的出租车GPS数据和气象数据,其时间间隔为2013年到2016年。
获取网址为:https://github.com/lucktroy/DeepST/tree/master/data/TaxiBJ