交通运输数据技术 作业五 -基于共享单车出行数据的聚类分析

数据集

数据集包含共享单车的出行数据,其中每条记录表示一次共享单车的行程。以下是数据集中的列及其含义:

1.‘bike ID’: 共享单车的唯一标识符。
2.‘otime’: 出发时间,表示共享单车行程的开始时间。
3.‘olgt’: O点经度,表示起始点的经度坐标。
4.‘olat’: O点纬度,表示起始点的纬度坐标。
5.‘dlgt’: D点经度,表示目的地的经度坐标。
6.‘dlat’: D点纬度,表示目的地的纬度坐标。
7.‘time’: 行程时间,表示共享单车行程的持续时间。

每条记录代表了一次共享单车行程的相关信息,包括出发时间、起始点的经纬度、目的地的经纬度和行程时间。这些信息可以用于进行聚类分析,发现共享单车行程数据中的潜在模式和结构。

数据预处理

首先,根据每条出行记录的起始点(O点)和目的地(D点)的经纬度坐标,使用Haversine公式计算了估算的出行距离(单位:km)。这个距离是通过计算地球上两个点之间的球面距离得出的,考虑了地球的曲率。

在这里插入图片描述

其次,根据行程时间和估算的出行距离,计算了共享单车的骑行速度(单位:km/h)。行程时间通过将时间字符串转换为时间类型,并转换为以秒为单位的数值。骑行速度通过将估算的出行距离除以行程时间,并乘以3600转换为小时单位得到。

最后,根据骑行速度的合理范围限制ÿ

猜你喜欢

转载自blog.csdn.net/weixin_54707168/article/details/132661164