pandas数据分析,看这个项目总结就够了(四:时间序列)

原文地址:https://www.kesci.com/home/project/5c418c295c4cef002c33940d/code注:代码是在Pycharm上写的。:这部分使用数据和之前有所不同,不再是国家统计局的数据了。


# 10. 时间序列

import pandasas pd

import matplotlib.pyplot as plt

# %matplotlib inline

注:此处解释一下最后一行:%matplotlib inline

用python的IDE如spyder或者pycharm,这个地方都会报错,显示是invalid syntax(无效语法),因为我用的pycharm,因此将其注释掉了。

%matplotlib是在使用jupyter notebook 或者 jupyter qtconsole的时候,才会经常用到,具体作用是当你调用matplotlib.pyplot的绘图函数plot()进行绘图的时候,或者生成一个figure画布的时候,可以直接在你的python console里面生成图像。

而在pycharm中,可以通过plt.show()来生成图像。

df_date = pd.read_csv("results.csv")

print(df_date.shape)   #数据是二维iede,输出行数和列数

df_date.head()

# 10.1 构造时间序列特征

# 将字符串时间转换为 datetime 时间模式

# pd.to_datetime(data, format, errors)

print(df_date.dtypes) #输出的date类型为object

df_date['date'] = pd.to_datetime(df_date['date'])

print(df_date.dtypes) #输出的date类型为datetime64[ns]

# 开始构造新的时间序列

# 下面每个特征生成了新的列

df_date['year'] = df_date['date'].dt.year   # 构造 'year' 年份特征

df_date['month'] = df_date['date'].dt.month   # 构造 'month' 月份特征

df_date['day'] = df_date['date'].dt.day   # 构造 'day' 日份特征

df_date['hour'] = df_date['date'].dt.hour   # 构造 'hour' 小时特征

df_date['minute'] = df_date['date'].dt.minute   # 构造 'minute' 分钟特征

df_date['second'] = df_date['date'].dt.second   # 构造 'second' 秒钟特征

df_date['week'] = df_date['date'].dt.week   # 构造 'week' 周数特征

df_date['weekday'] = df_date['date'].dt.weekday +1   # 构造 'weekday' 星期几特征

print(df_date.columns)

df_date.head()

转载于:https://www.jianshu.com/p/d09ef1f1f4f5

猜你喜欢

转载自blog.csdn.net/weixin_34061482/article/details/91121768