机器学习——距离度量


特征空间中两个实例点的距离是两个实例点相似程度的反映。

L p L_p 距离

设特征空间 X \mathcal X n n 维实数向量空间 R n \bf R^n x i , x j X x_i, x_j \in \mathcal X x i = ( x i ( 1 ) , x i ( 2 ) , . . . , x i ( n ) ) T x_i=(x_i^{(1)}, x_i^{(2)},..., x_i^{(n)})^T x j = ( x j ( 1 ) , x j ( 2 ) , . . . , x j ( n ) ) T x_j=(x_j^{(1)}, x_j^{(2)},..., x_j^{(n)})^T x i , x j x_i, x_j L p \bm{L_p} 距离定义为:
L p ( x i , x j ) = ( l = 1 n x i ( l ) x j ( l ) p ) 1 p L_p(x_i, x_j)=(\sum_{l=1}^n |x_i^{(l)}-x_j^{(l)}|^p)^{\frac{1}{p}} 这里 p 1 p\ge 1

欧式距离

p = 2 p=2 时,称为欧式距离,即:
L 2 ( x i , x j ) = ( l = 1 n x i ( l ) x j ( l ) 2 ) 1 2 L_2(x_i, x_j)=(\sum_{l=1}^n |x_i^{(l)}-x_j^{(l)}|^2)^{\frac{1}{2}}

曼哈顿距离

p = 1 p=1 时,称为曼哈顿距离,即:
L 1 ( x i , x j ) = l = 1 n x i ( l ) x j ( l ) L_1(x_i, x_j)=\sum_{l=1}^n |x_i^{(l)}-x_j^{(l)}|

L L_{\infty} 距离

p = p=\infty 时,它是各个坐标距离的最大值,即:
L ( x i , x j ) = max l x i ( l ) x j ( l ) L_{\infty}(x_i, x_j)=\max_l |x_i^{(l)}-x_j^{(l)}|

参考文献

[1] 李航. 统计学习方法. 清华大学出版社. 2012

猜你喜欢

转载自blog.csdn.net/qq_38021750/article/details/89739845