假设原始数据为
,其协方差矩阵
为对称矩阵,协方差矩阵的特征分解为
其中 为特征向量组成的正交矩阵,每一列是一个特征向量,所有特征向量组成一组正交基,根据 对数据进行坐标旋转后消除相关性; 为特征值组成的对角矩阵,它实际上是旋转后的数据的协方差矩阵,由于旋转后的数据各维度是相互独立的,所以协方差为零,只有对角线有值,即每个维度的方差,利用 可对旋转后的数据进行缩放(利用旋转后每个维度的方差)。
首先对数据进行旋转
再对
进行缩放,除以各维度的标准差
这就是马氏变换,在马氏变换后的空间
中计算欧式距离就相应得到原始空间
的马氏距离。马氏距离的推导见。