ピアソン、ケンドール、スピアマンの相関関係

 まず、ピアソン相関

統計 2つの変数はXとYを測定するために使用されている間に、ピアソン相関係数(ピアソン相関係数)は、また、(ピアソンの積率相関係数、または単にのPCCのPPMCC呼ぶ)ピアソンの積率相関係数として知られています相関(線形相関)、-1と1の間の値。

それはであるカール・ピアソンからフランシス・ゴルトン進化の1880年代に提案されている類似しているが、わずかに異なる発想から。また、「ピアソンの積率相関係数」と呼ばれ、相関係数、

定義

二つの変数間の2つの変数間のピアソン相関係数は以下のように定義される 共分散 および 標準偏差 商の:
それは全体的な相関係数に定義され、一般的にギリシャ小文字を使用する   代表的なシンボルとして。推定された サンプルの 共分散とピアソン相関係数は、一般的な英語の小文字文字の得られた標準偏差    を代表します。
 
  或いはによって サンプルポイント 標準スコアは同等の表現を与えるために、上記の式を推定平均します:  
特徴      及び   それぞれがある  画分の標準サンプル、サンプル平均値及びサンプル標準偏差

相関係数    

0.8から1.0関連性の高い
0.6〜0.8の強い相関
0.4〜0.6適度な相関
0.2-0.4弱い相関
0.0から0.2非常に弱い相関または無相関

使用条件

二つの変数の標準偏差がゼロでない場合、相関係数の唯一の定義は、ピアソン相関係数が適しています。

(1)2つの変数間の線形関係を、連続したデータです。

(2)2つの変数は、一般に、正常またはほぼ正常な単峰性分布です。

(3)、これらの変数の観測値が対になっており、各対は、独立した観測結果です。

 第二に、ケンドール相関(ケンドール)

定義ケンダル(ケンダル)係数:nは統計的標的特異的性質の類似のソートは、他の特性は、通常、スクランブルされます。同じ(一致対)の配列と等圧の比率(不一致ペア)との合計数との差として定義される(N *(N-1)/ 2)ケンダル(ケンダル)係数です。

R =(P-(N *(N-1)/ 2-P))/(N *(N-1)/ 2)=(4P /(N *(N-1))) - 1

適用性

データのスピアマン相関係数のケンドールの相関係数は、同じ条件を必要とします

 第三に、スピアマンの相関(スピアマン)

二つの変数依存性ノンパラメトリック指標の。これは、使用して単調な相関評価式に2つの統計変数を。いかなるデータ値が繰り返されていない場合、および2つの完全に単調に関連した変数は、スピアマンの相関係数が+1または-1であった場合。

スピアマンの相関係数は、とのレベル変数として定義される ピアソン相関係数 サンプルサイズのために N個 のサンプルの、 N個の 生データは、相関係数ρの階調データに変換されます。
若しくは

 

全体的なデータの順に平均位置に基づいて、生データは、それぞれのレベルが割り当てられます。

 

 四、3つの依存選択

http://www.datasoldier.net/archives/716


 

拡張:
内共分散(共分散)確率論統計で全体の2つの変数を測定するために使用されるエラー
期待値である E [ X ]と E [ Y 二つの実確率変数] X Yの 間の共分散 Covを(X、Y)は 次のように定義されます。
期待 :数学的期待値(平均)(又は 平均値 も期待と呼ばれる)は、おそらく各試験の結果である 確率 の和の結果を乗じ
以下は、重要な特性の数学的期待値です。
1。
2。
3。
4.ときX及びYは、独立して、時間の、
しばしば呼ばれる 平均二乗偏差を 算術平均の平均平方根からの偏差の二乗であり、σとして発現

 

おすすめ

転載: www.cnblogs.com/icase/p/11244591.html