ユークリッド距離やコサイン類似度:一般に、距離メトリックは、二つの方法を使用しました
最初の一般的な使用は、より長い距離を、標準化前ユークリッド距離スケール影響指標は、したがって、異なるユニットによって影響を受ける個人差も大きいです
コサイン類似度指数スケール類似性尺度が衝撃によって影響を受けない、[1,1]、間隔が大きい余弦値、より類似しています。
1、ユークリッド距離:また、ユークリッド距離としても知られています
二つ以上の点の表記の間の距離
D(X、Y)= SQRT((X1-Y1)^ 2 +(X2-Y2)^ 2 + ... +(XN-A)^ 2)
改良された方法1:
標準化されたユークリッド距離:各成分の分布のためには、コンポーネントのそれぞれが平均及び分散同じに標準化され、矛盾しています
平均成分)/成分標準偏差 - :(標準化前の正規化値の後
改良された方法2:
マハラノビス距離:口座に様々な特性間のリンクを取る点と分布との間の距離、およびスケールに依存しません。
μは平均、共分散、Σ多変数ベクトル、マハラノビス距離SQRT( - 1)(X-μ)(X-μ)Σ^()であるため
図2に示すように、コサイン類似度を算出します
サイズは2つの個人差間のベクトル空間の尺度として2つのベクトル間の角度の余弦と。
COS(セタ)=(A ^ 2 + B ^ 2-C ^ 2)/(2AB)
若しくは
COS(セタ)=(* b)は/(|| || || X || B)
若しくは
(X1、Y1)*(X2、Y2)/ SQRT(X1 ^ 2 + Y1 ^ 2)xsqrt(×2 ^ 2 ^ 2 + Y2)
==
(X1X2、+ Y1Y2)/ SQRT(X1 ^ 2 + Y1 ^ 2)xsqrt(×2 ^ 2 + Y2 ^ 2)