距离度量

1.闵可夫斯基距离

这里写图片描述
这里写图片描述
这里写图片描述

闵氏距离的缺点:
(1)将各个分量的量纲(scale),也就是“单位”相同的看待了;
(2)未考虑各个分量的分布(期望,方差等)可能是不同的。

2.马氏距离

这里写图片描述

马氏距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。
这里写图片描述

这里写图片描述

排除变量之间的相关性的干扰;
马氏距离的计算是建立在总体样本的基础上的,如果拿同样的两个样本,放入两个不同的总体中,最后计算得出的两个样本间的马氏距离通常是不相同的,除非这两个总体的协方差矩阵碰巧相同;

3. 标准化欧氏距离

这里写图片描述

猜你喜欢

转载自blog.csdn.net/MESSI_JAMES/article/details/81051451