PCA(主成分分析)算法

设有\(m\)个指标,\(n\)个样本的原始数据

  1. 将原始数据按列组成矩阵 \(X _ { n \times m }\)
  2. \(X\) 的每一列进行中心化
  3. \(X\)的协方差矩阵\(\Sigma _ { X } = \frac { 1 } { n - 1 } X ^ { T } X\)
  4. 求出 \(\Sigma _ { X }\) 的特征值及对应的特征向
  5. 将特征值按照从大到小构成对角矩阵\(\Lambda = \left( \begin{array} { l l l l } { \lambda _ { 1 } } & { \lambda _ { 2 } } & { \cdots } & { \lambda _ { m } } \end{array} \right)\) 将特征向量按照对应特征值构成矩阵 \(A\)
  6. 根据贡献率确定主成分个数\(r\)
  7. 根据主成分个数\(r\),选择\(A\)的前\(r\)列构成矩阵\(P\)
  8. \(Y=XP\)即为主成分得分

注意:以上步骤中矩阵 \(X\),\(Y\)的列表示指标,矩阵\(A\),\(P\)的列表示特征向量
若需要推导步骤,留言后我会抽时间整理上传

敬请大家批评指正

声明

欢迎转载,请注明出处和作者。
作者:Arlen Lee
出处:https://www.cnblogs.com/algori/p/11141551.html

猜你喜欢

转载自www.cnblogs.com/algori/p/11141551.html