ジャカード相関と谷本係数

ジャカード係数は二組、大きい方の値、大きい類似度との間の相関の測度です。ジャカード係数に関しては、ジャカードは、2つのサンプルセットの距離差を測定するために使用されます。

ジャカード相関係数:

 

ジャカード距離:

 

値A、集合Bの要素は、2つの値(0、0、またはこの要素の代わりに、セット内のこのセットでは、この要素の代表ではない)を相関係数とジャカードジャカード距離がこれを見つけることである場合:

代表M11 A、セットBは1と同一位置の数であります

M01の代表は、要素の同じ位置が0であり、そしてBは、数1設定された設定しました

M10の代表は、要素の位置と同じに設定し、Bは数値0に設定されています

代表M00 Aは、同一の同じ位置に設定Bは数0であります

唯一のM11を考慮すれば、ほとんどの場合には、かなり多くのゼロの数よりも1番なので、非常に非常にスパースになります、があります。

S = M11 /(M00 + M10 + M01 + M11は)ジャカードの距離を呼び

 

また、ジャカードの一般化された相関係数として知られているタニモト係数

 

 A、Bは、2つのサンプルのベクトルを表します

 

 

おすすめ

転載: www.cnblogs.com/Kevin-Heydn-Wong/p/12243046.html