协方差求解方法

1. 协方差定义

X、Y 是两个随机变量，X、Y 的协方差 cov(X, Y) 定义为：

$cov(X,Y)=E[(X-\mu_x)(Y-\mu_y)]$

其中：

$E(X) = \mu_x$ 、 $E(Y) = \mu_y$

2. 协方差矩阵定义

矩阵中的数据按行排列与按列排列求出的协方差矩阵是不同的，这里默认数据是按行排列。即每一行是一个observation(or sample)，那么每一列就是一个随机变量。

$X_{m\times{n}}=\begin{bmatrix}a_{11} &a_{12} &\cdots &a_{1n} \\ a_{21} &a_{22} &\cdots &a_{2n} \\ \vdots &\vdots & \vdots& \vdots \\a_{m1} &a_{m2} &\cdots &a_{mn} \\ \end{bmatrix}=\begin{bmatrix}c_1 &c_2 &\cdots&c_n \\ \end{bmatrix}$

协方差矩阵：

$covMatrix = \frac{1}{m-1}\begin{bmatrix}cov(c_1,c_1) &cov(c_1,c_2) &\cdots &cov(c_1,c_n) \\ cov(c_2,c_1) &cov(c_2,c_2) &\cdots &cov(c_2,c_n) \\ \vdots &\vdots &\vdots &\vdots \\ cov(c_n,c_1) &cov(c_n,c_2) &\cdots &cov(c_n,c_n) \end{bmatrix}$

协方差矩阵的维度等于随机变量的个数，即每一个 observation 的维度。在某些场合前边也会出现 1 / m，而不是 1 / (m - 1).

3. 求解协方差矩阵的步骤

举个例子，矩阵 X 按行排列：

$X = \begin{bmatrix}1 &2 &3 \\ 3&1 &1 \end{bmatrix}=\begin{bmatrix}c_1 &c_2 & c_3\end{bmatrix}$

1. 求每个维度的平均值

$\bar{c} =\begin{bmatrix}2 &1.5 &2 \end{bmatrix}= \begin{bmatrix}\bar{c_1} &\bar{c_2} &\bar{c_3} \end{bmatrix}$

2. 将 X 的每一列减去平均值

$X=\begin{bmatrix}-1 &0.5 &1 \\ 1 & -0.5 &-1 \end{bmatrix}$

其中：

$c_i=c_i-\bar{c_i}$

3. 计算协方差矩阵

$cov =\frac{1}{m-1}X^{T}X=\frac{1}{2-1} \begin{bmatrix} 2& -1 & -2\\ -1 &0.5 &1 \\ -2&1 &2 \end{bmatrix}$

注意：

有时候在书上或者网上会看到这样的公式，协方差矩阵 Σ：

$\Sigma = \frac{1}{m}\sum_{i=1}^m{(X^i) \cdot ({X^i})^T}$

这里之所以会是 X * X’ 是因为原始数据集 X 是按列排列的，即：

$X = \begin{Bmatrix}X^1 &X^2 &\cdots & X^n\end{Bmatrix}$

另外在 opencv 文档中关于计算协方差矩阵的 calcCovarMatrix 函数的说明我觉得是有问题的，

在正常的 CV_COVAR_NORMAL 状态下它给出的 cov = scale * X * X’，而这个定义仅仅是在数据按列排列下才有的，即 CV_COVAR_COLS.

URL：http://docs.opencv.org/modules/core/doc/operations_on_arrays.html?highlight=calccovarmatrix#cv.CalcCovarMatrix

这里有一个按列排列的 PCA 教程，可以参考一下：

http://ufldl.stanford.edu/wiki/index.php/%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90

matlab 代码：


     
     
      
      
       
       
        
        
       
       
       
       
        
        
         
         clear; clc;
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
         
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
        
         
         % data are stored 
         
         as rows.
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
        
         
         X = [
         
         1 
         
         2 
         
         3;
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
             
         
         3 
         
         1 
         
         1];
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
         
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
        
         
         Y = X;
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
         
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
        
         
         [rows, cols] = size(X);
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
         
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
        
         
         % 
         
         get mean 
         
         of 
         
         each dimension(
         
         each column).
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
        
         
         meanMatrix = mean(X);
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
         
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
        
         
         % X - mean.
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
        
         
         X = X - ones(rows, 
         
         1) * meanMatrix;
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
         
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
        
         
         % 
         
         get the cov matrix.
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
        
         
         covMatrix = 
         
         1 / (rows - 
         
         1) * (X
         
         ’ * X)
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
         
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
        
         
         % the given 
         
         ’cov’ function
        
        
       
       
      
      
       
       
        
        
       
       
       
       
        
        
         
         cov(Y)