初心者のデータマイニング-データ探索(7):Python拡張統計機能関数の主なデータ探索関数

パンダライブラリの累積計算統計特性関数:

1、cumsum()

最初の1、2、...、n個の数の合計を順番に与えます

2 od購入()

最初の1、2、...、n個の数の積を順番に与えます

3、cummax()

最初の1、2、...、n個の数の最大値を順番に与えます

4、cummin()

最初の1、2、...、n個の最小値を順番に与えます

注意:

cum series関数は、DataFrameまたはseriesオブジェクトのメソッドとして表示されます

命名形式:D.cumsm()

pandasライブラリのローリング計算統計機能関数:

1、rolling_sum()

データサンプルの合計を計算する(列ごとに計算)

2、rolling_mean()

データサンプルの算術平均を計算します

3、rolling_var()

データサンプルの分散を計算します

4、rolling_std()

データサンプルの標準偏差を計算します

5、rolling_corr()

データサンプルのスピアマン(ピアソン)相関係数行列を計算します

6、rolling_cov()

データサンプルの共分散行列を計算します

7、rolling_skew()

サンプル値の歪度を計算します(3次モーメント)

8、rolling_kurt()

サンプル値の尖度を計算します(4次モーメント)

注意:

ローリングシリーズ関数はパンダ関数であり、DataFrameまたはシリーズオブジェクトのメソッドではありません。したがって、ローリングシリーズ関数の形式はpd.rolling_mean(Dk)です。つまり、平均値はk列ごとに1回計算されます。

例:

import pandas as pd
D=pd.Series(range(0, 20))  # 构造Series,内容为0~19共20个整数
print(D)

ここに画像の説明を挿入

print('前n项和:\n',D.cumsum())  # 给出前n项和

ここに画像の説明を挿入

print('相邻两项求和:\n',D.rolling(2).sum())  # 依次对相邻两项求和

ここに画像の説明を挿入

おすすめ

転載: blog.csdn.net/qq_45154565/article/details/110849878