Pythonのnumpyのパッケージとパッケージのパンダは、その使用法をまとめ、平均、分散を計算することができます。
1. numpyの標準偏差、平均、分散を算出
概して平均方法がnumpyの平均することによって得ることができます。
>>> インポートNPとしてnumpyの >>> = [5、6、16、9 ] >>> np.mean() 9.0
numpyの平均法は、単純な平均で得ることができず、加重平均を得ることができます。次のような権利の数の配列であるパラメータを続けることができ、平均重量、
>>> np.average() >>> 9.0 >>> np.average(重み= [1、2、1、1 ]) >>> 8.4
必要なパラメータを用いて、F = 1、例えばDDO - 分散を計算する際に、numpyのVAR関数で利用することができる、デフォルトでは、母分散(サンプル数N計算で割った)は、(1時間Nを割ることによって計算される)サンプルの分散を得るために必要ならばです
>>> インポートpnumpy AS NP >>> A = [5 ,. 6、16 ,. 9 ] >>> np.var(A) #母分散算出 18.5を >>> np.var(A、DDOF = 1)#の計算試料分散 24.666666666666668 >>> B = [[4 ,. 5]、[6 ,. 7 ] >>> B [ 4 ,. 5]、[6 ,. 7 ] >>> np.var(B) #計算行列分散のすべての要素 1.25 >>> np.var(B、軸= 0) #各列のマトリックスのための分散を算出 アレイ([1、1 ]) >>> np.var(B、軸= 1) #の計算各ラインの分散行列 アレイ([0.25、0.25])
標準偏差を計算し、VARなどnumpyのSTD機能、使用および機能で利用することができる、母集団の標準偏差のデフォルト、必要なパラメータDDOF = 1で、サンプル標準偏差を得るために必要ならば、
>>> インポートpnumpy AS NP >>> A = [5 ,. 6、16 ,. 9 ] >>> np.std(A) #全体の標準偏差を算出 4.301162633521313 >>> np.std(A、DDOF = 1) #サンプル標準偏差算出 4.96655480858378 >>> np.std(B) #全ての行列要素の標準偏差算出 1.118033988749895を >>> np.std(B、軸= 0) #行列の各列のための計算標準偏差 アレイ([1、 1 。]) >>> np.std(B、軸= 1) #計算行列の各列の標準偏差 アレイ([0.5、0.5])
2.パンダは、平均、分散、標準偏差計算
PANDASための関数の平均平均は、例えば、すべての行またはすべての列について決定することができる内部で、使用することもできます。
>>> インポートPANDAS AS PD >>> DF = pd.DataFrame(np.array([85、68、90]、[82、63は、88]、[84、90、78])、カラム= [ 「統計」、「高番号」、「英語」 ]、インデックス= [ 「ジョン・ドウ」、「ジョン・ドウ」、「王ウー」]) >>> DF 英語の統計的に高い数 張 856890 ドウ 826 388 ワング・ウ 84 90 78 >>> df.mean() #を示し、各列の平均 統計 83.666667 高い番号 73。666667 英語85.333333 DTYPE:のfloat64 (軸= 1)>>> df.mean #の番組の各列の平均 81.000000着座 ドウ 77.666667 ワング・ウ 84.000000 DTYPEを:のfloat64
行または平均値の列を得るために、ILOC転用使用されるか、または、例えば、得られる平均関数続くデータの列を選択してもよいです。
>>> DF 英語の統計的に高い数 張 856890 ジョン・ドウ 826 388 ワング・ウ 84 90 78 df.iloc [0 ,:] >>>。平均() #最初の行にして得られた平均値 81.0 >> > df.iloc [:2] .mean() #3列の平均値を取得する 85.33333333333333を
パンダ機能サンプル分散VAR(注記しない一般的分散)であることができる、STD関数はサンプル標準偏差、行または列を得るための分散することができ、ILOC行または列、バックトークVARを選択も利用可能ですSTD関数や機能例:
Df.var >>>() #の各列の表示分散 統計2.333333 高い番号 206.333333 英語 41.333333 DTYPE:のfloat64 >>> df.var(軸= 1)#1 の各列の表示分散 133.000000着座 ジョン・ドウ 170.333333 Wangwuを 36.000000 DTYPE:のfloat64 >>> df.std()#1 表示の各列の標準偏差 統計1.527525 高い数 14.364308 英語 6.429101 DTYPE:のfloat64 >>> df.std(軸= 1)#1 の各ラインの標準偏差を表示 ジョー・スミス11.532563 ジョン・ドウ 13.051181 王5 6.000000 dtypeは:のfloat64 。>>> df.iloc [0 ,:] STD() #最初の表示ラインの標準偏差1。 11.532562594670797 >>> df.iloc [:2] .std() #は3の標準偏差を示し 6.429100507328636を