(この記事は、独自の研究ノート、非基準値)
主成分分析(PCA)
計算量を低減しつつ、PCAアルゴリズムは、低次元の特徴(線形相関)に高次元の特徴を変換します。
原則
- 列によって元のデータ OK 列の行列 ( 、属性 サンプル)
- 意志 ゼロ平均(プロパティフィールドを表す)各列、すなわち、与えるために、ラインの平均値を減算することによって
- 計算された共分散行列 (計算、以下を参照のこと)
- 計算された共分散行列 固有ベクトルおよび対応する固有値
- 対応する固有値の大きさにより固有ベクトルを取る前に、上から下への行によってマトリクス状に配置され 行のマトリックス
-
(データの次元削減で
、属性
サンプル)
([K、N - ] = [K、M] [M、N])
共分散について
共分散が定義されている。
同様の傾向は、2つの変数を変更した場合、共分散は、所望の総誤差の二つの変数によって表され、それは、期待値のいずれかが、その後、2つの変数をその期待値を超えた場合、それ自体が他よりも大きくなると言うことです間の共分散は正です。逆に。
共分散式:
の共分散行列:
のサンプルの数で分割された各属性と共分散の他の属性について計算(および最終的に
)。共分散行列が対角に沿って対称である、見ることができます。
固有値について
行列を解くことになりましたと
特性値
:
、特性値を取得します
固有ベクトルに対応するが、ガウスの消去法によって決定された行列Xは、置換前に、後に[
、
、
、...、
]。