numpyの計算

Pythonのnumpyのパッケージとパッケージのパンダは、その使用法をまとめ、平均、分散を計算することができます。
1. numpyの標準偏差、平均、分散を算出
概して平均方法がnumpyの平均することによって得ることができます。

>>> インポートNPとしてnumpyの
 >>> = [5、6、16、9 ]
 >>> np.mean()
 9.0

 

numpyの平均法は、単純な平均で得ることができず、加重平均を得ることができます。次のような権利の数の配列であるパラメータを続けることができ、平均重量、

>>> np.average()
 >>> 9.0 
>>> np.average(重み= [1、2、1、1 ])
 >>> 8.4


必要なパラメータを用いて、F = 1、例えばDDO - 分散を計算する際に、numpyのVAR関数で利用することができる、デフォルトでは、母分散(サンプル数N計算で割った)は、(1時間Nを割ることによって計算される)サンプルの分散を得るために必要ならばです

>>> インポートpnumpy AS NP
 >>> A = [5 ,. 6、16 ,. 9 ]
 >>> np.var(A) 母分散算出 
18.5を

>>> np.var(A、DDOF = 1)計算試料分散 
24.666666666666668 

>>> B = [[4 ,. 5]、[6 ,. 7 ]
 >>> B 
[ 4 ,. 5]、[6 ,. 7 ]

 >>> np.var(B) 計算行列分散のすべての要素 
1.25 

>>> np.var(B、軸= 0) 各列のマトリックスのための分散を算出 
アレイ([1、1 ])

 >>> np.var(B、軸= 1) 計算各ラインの分散行列 
アレイ([0.25、0.25])

 

標準偏差を計算し、VARなどnumpyのSTD機能、使用および機能で利用することができる、母集団の標準偏差のデフォルト、必要なパラメータDDOF = 1で、サンプル標準偏差を得るために必要ならば、

>>> インポートpnumpy AS NP
 >>> A = [5 ,. 6、16 ,. 9 ]
 >>> np.std(A) 全体の標準偏差を算出 
4.301162633521313 

>>> np.std(A、DDOF = 1) サンプル標準偏差算出 
4.96655480858378 

>>> np.std(B) 全ての行列要素の標準偏差算出 
1.118033988749895を

>>> np.std(B、軸= 0) 行列の各列のための計算標準偏差 
アレイ([1、 1 。])

 >>> np.std(B、軸= 1) 計算行列の各列の標準偏差 
アレイ([0.5、0.5])


2.パンダは、平均、分散、標準偏差計算
PANDASための関数の平均平均は、例えば、すべての行またはすべての列について決定することができる内部で、使用することもできます。

>>> インポートPANDAS AS PD
 >>> DF = pd.DataFrame(np.array([85、68、90]、[82、63は、88]、[84、90、78])、カラム= [ 統計高番号英語 ]、インデックス= [ ジョン・ドウジョン・ドウ王ウー])
 >>> DF 
英語の統計的に高い数 856890 
ドウ 826 388 
ワング・ウ 84 90 78 

>>> df.mean() 示し、各列の平均

統計 83.666667 
高い番号 73。666667 
英語85.333333 
DTYPE:のfloat64

(軸= 1)>>> df.mean #の番組の各列の平均 
81.000000着座
ドウ 77.666667 
ワング・ウ 84.000000 
DTYPEを:のfloat64

 

行または平均値の列を得るために、ILOC転用使用されるか、または、例えば、得られる平均関数続くデータの列を選択してもよいです。

>>> DF 
英語の統計的に高い数 856890 
ジョン・ドウ 826 388 
ワング・ウ 84 90 78 

df.iloc [0 ,:] >>>。平均() 最初の行にして得られた平均値 
81.0 

>> > df.iloc [:2] .mean() 3列の平均値を取得する 
85.33333333333333を

 

パンダ機能サンプル分散VAR(注記しない一般的分散)であることができる、STD関数はサンプル標準偏差、行または列を得るための分散することができ、ILOC行または列、バックトークVARを選択も利用可能ですSTD関数や機能例:

Df.var >>>() 各列の表示分散 
統計2.333333 
高い番号 206.333333 
英語 41.333333 
DTYPE:のfloat64

 >>> df.var(軸= 1)#1 の各列の表示分散 
133.000000着座
ジョン・ドウ 170.333333 
Wangwuを 36.000000 
DTYPE:のfloat64

 >>> df.std()#1 表示の各列の標準偏差 
統計1.527525 
高い数 14.364308 
英語 6.429101 
DTYPE:のfloat64

 >>> df.std(軸= 1)#1 の各ラインの標準偏差を表示 
ジョー・スミス11.532563 
ジョン・ドウ 13.051181 
王5 6.000000 
dtypeは:のfloat64

。>>> df.iloc [0 ,:] STD() 最初の表示ラインの標準偏差1。 
11.532562594670797 

>>> df.iloc [:2] .std() 3の標準偏差を示し 
6.429100507328636を

 

おすすめ

転載: www.cnblogs.com/wt714/p/12394679.html