パンダの相関分析

DataFrame.corr(method = 'pearson'、min_periods = 1)

パラメータの説明:

メソッド:オプションの値は{'pearson'、 'kendall'、 'spearman'}です

               ピアソン:ピアソン相関係数は、2つのデータセットが直線上にあるかどうかを測定します。つまり、線形データの相関係数計算には、非線形データのエラーがあります。

                kendall:カテゴリー変数の相関を反映するために使用されるインジケーター、つまり、順序付けられていないシーケンス、非正規分布データの相関係数

                spearman:非線形、非正の分析データの相関係数

min_periods:サンプルの最小データ量

戻り値:タイプ間の相関係数のDataFrameテーブル。

異なるパラメータ間の違いを区別するために、私たちの実験は次のとおりです。

PANDAS インポートDATAFRAME
 インポートPANDAS AS PD 
X = [Aは、のために A 範囲(100 )]
 次方程式、非線形関係構成
DEF :y_x(X)
     リターン 2 4 * X ** 2 + 
Y = [y_x( I)のための I におけるX] 
 
データ {= DATAFRAME(' X ':X、' Y ' ):Y} 
 
#1 表示するデータのデータ構造
(data.head)を
OUT [ 34である]:
   XY 
0 0   。4 
。1. 1. 6 
2 2 12
3 3 22 
4 4 36 
 
data.corr()
OUT [ 35 ]:
          XY 
X   1.000000 0.967736 
Y   0.967736 1.000000 
 
data.corr(メソッド = ' スピアマン' 
OUT [ 36 ]:
     XY 
X   1.0 1.0 
Y   1.0 1.0 
 
data.corr(方法 = ' kendall ' 
Out [ 37 ]:
     xy 
x   1.0 1.0 
y   1.0 1.0

yは関数で構成されるため、xとyの相関係数は1ですが、実験構造は、ピアソン係数が非線形データに対して特定の誤差を持っていることを示しています。

送信元:https://blog.csdn.net/walking_visitor/article/details/85128461

おすすめ

転載: www.cnblogs.com/zhangzhixing/p/12742968.html