DataFrame.corr(method = 'pearson'、min_periods = 1)
パラメータの説明:
メソッド:オプションの値は{'pearson'、 'kendall'、 'spearman'}です
ピアソン:ピアソン相関係数は、2つのデータセットが直線上にあるかどうかを測定します。つまり、線形データの相関係数計算には、非線形データのエラーがあります。
kendall:カテゴリー変数の相関を反映するために使用されるインジケーター、つまり、順序付けられていないシーケンス、非正規分布データの相関係数
spearman:非線形、非正の分析データの相関係数
min_periods:サンプルの最小データ量
戻り値:タイプ間の相関係数のDataFrameテーブル。
異なるパラメータ間の違いを区別するために、私たちの実験は次のとおりです。
PANDAS インポートDATAFRAME インポートPANDAS AS PD X = [Aは、のために A に範囲(100 )] #次方程式、非線形関係構成 DEF :y_x(X) リターン 2 4 * X ** 2 + Y = [y_x( I)のための I におけるX] データ {= DATAFRAME(' X ':X、' Y ' ):Y} #1 表示するデータのデータ構造 (data.head)を OUT [ 34である]: XY 0 0 。4 。1. 1. 6 2 2 12 3 3 22 4 4 36 data.corr() OUT [ 35 ]: XY X 1.000000 0.967736 Y 0.967736 1.000000 data.corr(メソッド = ' スピアマン' ) OUT [ 36 ]: XY X 1.0 1.0 Y 1.0 1.0 data.corr(方法 = ' kendall ' ) Out [ 37 ]: xy x 1.0 1.0 y 1.0 1.0
yは関数で構成されるため、xとyの相関係数は1ですが、実験構造は、ピアソン係数が非線形データに対して特定の誤差を持っていることを示しています。
送信元:https://blog.csdn.net/walking_visitor/article/details/85128461