成分分析PCAと固有値と固有ベクトルの意義

https://blog.csdn.net/weixin_38314865/article/details/84190175

定義:
主成分分析(主成分分析、PCA)、統計的な手法です。直交線形独立の組、主成分と呼ばれる変換された変数のセットに可能な相関変数の変数セットが存在することによって変換します。PCAは、新しいk次元の直交特徴であるK次元(<N、K)にn次元の特徴をマッピングすることであると思いました。これは単にn次元の特徴から残りNK次元の特徴を除去するのではなく、主成分はk次元の特徴量に再構成されたk次元の特徴量と呼ばれます。
簡単な説明:

具体的には、我々は、n次元のデータセット、m個のデータの合計である場合。我々は、元のデータセットの代わりに、可能なm次元データセットそのK希望、nはM次元のk次元のデータにダウンこれらの寸法ことを望みます。私たちはそこにダウンn次元のk Vikenからのデータが損失になることを知っているが、我々は可能な限り小さく損失を願っています。だから、それを可能な限り元のデータのこのk次元のデータ表現を作るためにどのように?

N、つまり、最も単純なケースを見てみましょう= 2、K = 1、すなわち、一次元の次元削減に二次元のデータです。データは以下の通り。私たちは、これら2つの次元のデータを表すことができ、特定の次元方向を探していました。ベクターは、元のデータのより良い表現がそれを設定することができるベクター、U1とU2の方向に図2列?この方向に投影されたデータのサンプル点の間の最大差異ため、U2より良好U1、直感的にも見ることができます。

説明「線形代数の幾何学的な意味」を参照:「マトリックス乗算は、変換に対応し、ベクトルが他の方向又は新しいベクターに任意の長さであるが、変換の過程でしばしば異なっている、元のベクトル回転は、主に起こります。 、伸縮変化。マトリクスは、ベクターのみまたは特定のベクトルをスケーリングするために、これらのベクターは、回転の効果を生成しない発生した場合、これらのベクトルは固有ベクトル行列と呼ばれ、比が伸縮特徴量である。

数学的に上の派生、我々が知ることができ、軸の上に権利を取得したい固有ベクトルに対応する固有値は、データの分散に対応する特徴値は、回転後の座標の寸法に等しいです。

つまり、行列Aは、固有ベクトルを対応する直接導出特徴ベクトルが得られます。私たちは、右回転軸を見つけることができます。これは、固有値と固有ベクトルの実用的なアプリケーションである:「様々な寸法にして得られたデータは最大判別軸を達成するように。」

したがって、データ・マイニング、それが含有する固有ベクトルの方向に対応する固有値によって直接説明します情報の量、および特性値がすべての特徴の値で除算し、次のように値がある:貢献を特徴ベクトルの分散に(寄与率は、この次元情報の量に固有の分散の割合を表しています)。

データは、通常、ベクトル変換機能を主成分変数と呼ばれた後に、現在の累積分散の寄与率がより高いパーセンテージ(例えば、85%以上)に達するの主成分をM、それは、m個の主要コンポーネントのデータを保持します。データ次元削減の目的を達成します。全体の主成分分析アルゴリズムの原理は、このです。

おすすめ

転載: www.cnblogs.com/jwg-fendi/p/11098545.html