人工智能数学基础知识复习（二）——特征分解与奇异值分解（SVD）

今天我们复习一下线性代数中的矩阵特征分解与奇异值分解。本文将结合几何的角度来阐述这两个概念。

一、特征值与特征分解

假设我们现在有一个对角矩阵为：

$M = \begin{bmatrix} 3 & 0\\ 0 & 1 \end{bmatrix}$

将该矩阵作用于列向量 $[x, y]^{^{T}}$ ，则可以得到：

$\begin{bmatrix} 3 & 0\\ 0 & 1 \end{bmatrix}\begin{bmatrix} x\\ y \end{bmatrix}=\begin{bmatrix} 3x\\ y \end{bmatrix}$

从几何的角度，上式可以看做在平面上取一个点(x, y)并使用矩阵乘法将其变换为另外一个点。我们可以用下图表示上述变换：

由图中可以看出矩阵M使该平面在横轴方向变大了3倍，纵轴方向保持不变。

如果矩阵M换作下式是什么情况呢？

$M = \begin{bmatrix} 2&1 \\ 1& 2 \end{bmatrix}$

变换的效果会像下面这张图一样：

上面的图可能不是很直观，让我们把图片中的网格向左旋转45度观察：

现在，我们能够很明显地看到，M矩阵将向量在一个方向上拉伸了3倍，在另外一个方向上保持不变。在2*2对称矩阵作用下的结果，我们一般都需要通过旋转网格来观察。这样的矩阵一般会使原向量在其两个方向上产生拉伸或者反射，也就是说它对向量的作用和对角矩阵类似。

现在，我们来具体地看特征值和特征向量。

假设我们有一个对称矩阵M，那么我们可以找到一组正交向量 $v_{i}$ 使得 $Mv_{i}$ 是 $v_{i}$ 的常数（标量）倍，即：

$Mv_{i} = \lambda_{i} v_{i}$

也就意味着向量 $v_{i}$ 在被矩阵M乘以后发生了拉伸或者反射变换。因为上面的性质，我们把 $v_{i}$ 叫做矩阵M的特征向量，而 $\lambda_{i}$ 叫做矩阵M的特征值。需要注意的是，对应于不同特征值的特征向量相互之间应该是正交的。

结合上面的三张图，也就是我们的向量 $[x, y]^{^{T}}$ 被矩阵M（M是2*2的）作用，实际上就相当于将该向量旋转到M的两个相互正交的特征向量所在的网格中，然后再对其进行拉伸或者反射变换。还有一点需要的说明的是，虽然我们上面例子中的矩阵M都是对称矩阵，但实际上如果M是非对称矩阵，上述性质也是成立的。

可能这样说明特征值和特征向量还不够直观，那么我们可以考虑拳击的场景。在拳击场景下，特征向量决定了你出拳的方向，特征值就决定了你出拳的力度。

了解了特征值和特征向量后，我们可以很容易地理解特征分解，特征分解就是将一个可对角化的矩阵A分解成如下形式：

$A = Q\Lambda Q^{-1}$