-
rolling :
DataFrame.rolling(window, min_periods=None, freq=None, center=False, win_type=None, on=None, axis=0, closed=None)
window | min_periods | freq | center | win_type | on | axis | closed |
表示时间窗的大小,注意有两种形式(int or offset)。 如果使用int,则数值表示计算统计量的观测值的数量即向前几个数据。 如果是offset类型,表示时间窗的大小。pandas offset相关可以参考这里。 |
最少需要有值的观测点的数量,对于int类型,默认与window相等。对于offset类型,默认为1。 | 从0.18版本中已经被舍弃。 | 是否使用window的中间值作为label,默认为false。只能在window是int时使用。 | 窗口的类型。截取窗的各种函数。字符串类型,默认为None。 | 可选参数。对于dataframe而言,指定要计算滚动窗口的列。值为列名。 | int、字符串,默认为0,对列进行计算 | 定义区间的开闭,支持int类型的window。对于offset类型默认是左开右闭的即默认为right。可以根据情况指定为left both等。 |
-
method:
dataframe.rolling().mean()
dataframe.rolling().sum()
dataframe.rolling().var()
dataframe.rolling().std()
dataframe.rolling().corr()
dataframe.rolling().cov()
dataframe.rolling().skew()
dataframe.rolling().kurt()
dataframe.rolling().count()
dataframe.rolling().mean()
dataframe.rolling(window=20,center=True).mean()
每20个值为一个窗口,取其平均值作为新的数据点
dataframe.rolling().corr()
dataframe[column1].rolling(window=20,center=True).corr(dataframe[column2])
每20个值为一个单位,计算column1列窗口值与column2列窗口值相关系数,作为新的数据点