初学数据挖掘——数据探索(七):python中主要的数据探索函数之拓展统计特征函数

pandas库中累积计算统计特征函数:

1、cumsum()

依次给出前1,2,…,n个数的和

2、cumprod()

依次给出前1,2,…,n个数的积

3、cummax()

依次给出前1,2,…,n个数的最大值

4、cummin()

依次给出前1,2,…,n个数的最小值

注意:

cum系列函数是作为DataFrameseries对象的方法而出现的

命名格式:D.cumsm()

pandas库中滚动计算统计特征函数:

1、rolling_sum()

计算数据样本的总和(按列计算)

2、rolling_mean()

计算数据样本的算数平均数

3、rolling_var()

计算数据样本的方差

4、rolling_std()

计算数据样本的标准差

5、rolling_corr()

计算数据样本的spearman(Pearson)相关系数矩阵

扫描二维码关注公众号,回复: 13053574 查看本文章

6、rolling_cov()

计算数据样本的协方差矩阵

7、rolling_skew()

计算样本值的偏度(三阶矩)

8、rolling_kurt()

计算样本值的峰度(四阶矩)

注意:

rolling_系列函数是pandas函数,不是DataFrame或series对象的方法,因此,rolling_系列函数的使用格式是:pd.rolling_mean(D.k) 即每k列计算一次均值。

实例:

import pandas as pd
D=pd.Series(range(0, 20))  # 构造Series,内容为0~19共20个整数
print(D)

在这里插入图片描述

print('前n项和:\n',D.cumsum())  # 给出前n项和

在这里插入图片描述

print('相邻两项求和:\n',D.rolling(2).sum())  # 依次对相邻两项求和

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_45154565/article/details/110849878