原文地址:https://www.kesci.com/home/project/5c418c295c4cef002c33940d/code注:代码是在Pycharm上写的。注:这部分使用数据和之前有所不同,不再是国家统计局的数据了。
# 10. 时间序列
import pandasas pd
import matplotlib.pyplot as plt
# %matplotlib inline
注:此处解释一下最后一行:%matplotlib inline。
用python的IDE如spyder或者pycharm,这个地方都会报错,显示是invalid syntax(无效语法),因为我用的pycharm,因此将其注释掉了。
%matplotlib是在使用jupyter notebook 或者 jupyter qtconsole的时候,才会经常用到,具体作用是当你调用matplotlib.pyplot的绘图函数plot()进行绘图的时候,或者生成一个figure画布的时候,可以直接在你的python console里面生成图像。
而在pycharm中,可以通过plt.show()来生成图像。
df_date = pd.read_csv("results.csv")
print(df_date.shape) #数据是二维iede,输出行数和列数
df_date.head()
# 10.1 构造时间序列特征
# 将字符串时间转换为 datetime 时间模式
# pd.to_datetime(data, format, errors)
print(df_date.dtypes) #输出的date类型为object
df_date['date'] = pd.to_datetime(df_date['date'])
print(df_date.dtypes) #输出的date类型为datetime64[ns]
# 开始构造新的时间序列
# 下面每个特征生成了新的列
df_date['year'] = df_date['date'].dt.year # 构造 'year' 年份特征
df_date['month'] = df_date['date'].dt.month # 构造 'month' 月份特征
df_date['day'] = df_date['date'].dt.day # 构造 'day' 日份特征
df_date['hour'] = df_date['date'].dt.hour # 构造 'hour' 小时特征
df_date['minute'] = df_date['date'].dt.minute # 构造 'minute' 分钟特征
df_date['second'] = df_date['date'].dt.second # 构造 'second' 秒钟特征
df_date['week'] = df_date['date'].dt.week # 构造 'week' 周数特征
df_date['weekday'] = df_date['date'].dt.weekday +1 # 构造 'weekday' 星期几特征
print(df_date.columns)
df_date.head()
转载于:https://www.jianshu.com/p/d09ef1f1f4f5