2020中国高校计算机大赛·华为云大数据挑战赛热身赛——交通流量预测赛题分析(持续更新!!!)

2020中国高校计算机大赛·华为云大数据挑战赛热身赛_交通流量预测赛题分析(持续更新!!!)

写在前面:大家好!我是练习时长半年的在读本科生数据小白JerryX,各位数据挖掘大佬有什么问题和建议多多指教!!欢迎大家多多点赞,多多评论,多多批评指正!!

在这里插入图片描述

0. 赛题介绍

赛题背景
随着电子信息和移动通信技术高速发展和不断融合,人工智能在各个领域都相继取得了巨大的突破,城市智能体也应运而生,而城市交通又是城市智能体的核心。交通流量数据既是城市交通中的基础数据,又是反应交通状况的重要指标之一,准确预测交通流量对城市交通具有重大意义。本题以交通流量预测为目标,邀请各个队伍以历史交通流量数据建立对应的算法模型,预测目标流量数据,通过预测值和真实值之间的对比得到预测准确率,以此来评估各队伍所提交的预测算法。

赛题说明
本次比赛任务是利用历史数据结合地图信息,预测五和张衡交叉路口未来一周周一(2019年2月11日)和周四(2019年2月14日)两天的5:00-21:00通过wuhe_zhangheng路口4个方向的车流量总和
要求模型输出格式如下: {“data”:{“resp_data”:{“wuhe_zhangheng”:[1,4,5,6,4…]}}}从5:00开始每5min的预测数据,第一个数据为5:00-5:05的流量值,最后一个数据为20:55-21:00。两天的数据按时间先后放在一起,总共有384个数据。
小提示:如果不考虑天气周边活动节假日等因素,预测结果可能不准确哦。

数据说明
本次比赛提供4周(2019.1.12 – 2019.2.8)深圳龙岗区坂田街道交通流量历史数据。车流数据格式如下:
在这里插入图片描述
其中,time为上述格式时间字符串,cross为路口名,direction为车流起始方向,leftFlow是左转车流,straightFlow是直行车流。
说明:
(1) 十字路口包含四个方向车流数据,此处未全部列出。
(2) 路口名称分别为:五和路、张衡路、稼先路、隆平路、冲之大道。可以通过但不限于百度地图等地图软件获取地图路网信息。
(3) 因为右转车流不受信号灯控制,因此未做统计。

!获取地图路网信息友情链接:五和大道张衡路路口百度地图

评分标准
第一部分(分类问题)
分类问题评价标准:
在这里插入图片描述

预测的评价是通过每一个5min预测车流和真实通过车流对比,看看趋势是否一致(比如10月19日的5:00到5:05的真实车流是4,10月20日的5:00到5:05的真实车流为5,那么只要车流预测值大于4,就得100分,最后得分为所有得分求加权平均(权重为该时间段所在小时的车流量占16小时总车流的比重))。

第二部分(回归问题)
回归问题评价标准:
在这里插入图片描述

预测的评价还是通过每一个5min 预测车流和真实通过车流通过grade公式计算最后得分,加权细则与第一部分相同:其中wi为权重,xj为真实车流数据,xj拔为预测车流数据,ε为e-9。

最后将两部分分数做归一化处理,第一部分占比40%,第二部分占比60%。

============================ 我是分割线======================================
下面我们在赛题数据还没有出来之前,先从地图角度出发分析一下有什么地图信息可以挖掘一下吧!!

1. 预测目标地理位置可视化:五和张衡交叉路口

所谓“知己知彼,百战百胜”,我们先来看看我们的目标预测位置有什么地理特点吧!
先看看局部的地理位置:
五和张衡交叉路口
再来看看整体的地理位置:在这里插入图片描述
震惊!!原来是华为的老巢!!那么朝九晚五必然是我们要考虑到的一个重要的特征啦!

2. 流量与时间关系地理位置初步可视化分析

借助百度地图的流量预测功能,我们可以直观的看到一周7天不同时间段的基本的车流量情况。下面我们进一步初步分析,可以得到两个结论:
1.任老板的公司不仅朝九晚五,竟然还有 十点的狂欢(再一次震惊!)可见下面三张图:
“朝九”

“晚五”

“十点狂欢”

3.简单空间拓扑结构信息抽取思路介绍

看到地图,我们就能够想到要建图抽取特征啦!我们在这道题目里面可以把道路看成边,路口看成结点,组织成一个简单的图结构

在这里插入图片描述

通过百度地图好用的测距功能,我们就可以很方便地抽取出来空间结构信息,以便后续进一步挖掘不同路口结点之间的流量关系啦!

在这里插入图片描述
我们可以使用邻接矩阵抽特征的方式,将拓扑图结构的空间相关性在特征层建模出来,使得时序神经网络模型/传统机器学习方法也能够处理复杂图结构的空间相关性问题。

先分析那么多啦,夜深先睡了,明天数据集公布了以后再进一步分析下数据吧~
感谢大家的耐心阅读,有什么建议欢迎大家在评论里提出来哦~~
这篇文章会持续更新,记录自己的一点心得,分享一些好的paper~
也请大家多多指教!!

发布了8 篇原创文章 · 获赞 5 · 访问量 3947

猜你喜欢

转载自blog.csdn.net/weixin_43945120/article/details/105549069