二つのタスク:主成分分析:ステップ、及びアプリケーションコード。あなたは、任意のプログラミング言語を使用することができ、コードに精通しています。
主成分分析は、主成分のそのような次元削減手法を生成するいくつかの指標の総合的な分析のような統計的多重指標であり、それは通常線形元の変数として表さ最も情報の元の変数を反映することができます組み合わせ。思想PCAは、M次元(M <N)、m次元直交新機能である上のn次元の特徴をマッピングすることではなく、単にNから、そのm次元再構築に特徴付け主成分と称される前記NMは、次元の特徴の寸法を減算します。PCAの核となるアイデアは、データを区別することが容易であり、投影データの方向に沿って最大です。
PCMの次元削減は、以下の工程:
センタリング後の新たなデータの平均値を差し引いたオリジナルデータ; 1.我々は、一般的に行を選択し、各特徴について平均特性です。
機能の共分散行列を求めている2。
共分散行列固有値と固有ベクトル
構成に応じて降順で前記固有値は、投影行列を見つけ、いくつかの主要なコンポーネントを選択し、対応する特徴ベクトルを与えます。
我々の投影行列次元削減に応じて得られたデータ。
PCMアプリケーション:
-
主成分分类
異なる指標を収集するために、主成分分析、散布図は、見ることができ、それは分類することができます。
-
主成分回归
複数の独立変数が共通に表示する際に、主成分分析は、古典的回帰を克服するには不十分です
MathWorks社のMATLABコードの実装
ステップ:
1.データの中心
2.シーク機能の共分散行列
共分散行列の固有値と固有ベクトルのを見つける3
、昇順kの最大値を取り、対応する固有ベクトルで前記特徴量は、マトリックスKからなる列ベクトルとして特徴付けられます
5.選択されたサンプル点が選択された特徴ベクトルK上に投影しました
すべて;
すべてを閉じます。
X = [2.5 2.4。
0.5 0.7。
2.2 2.9。
1.9 2.2。
3.1 3.0;
2.3 2.7;
2 1.6。
1 1.1。
1.5 1.6;
1.1 0.9;]。
X = X」
%X = [87 74
84 88 74 86 69 73 64。
%
85 83 83 77 69 84 74 85 84。
%
83 91 89 85 87 86 83 86 85。
%
69 100 82 96 84 82 97 98 76。
%
46 53 88 89 97 97 48 89 36。
%
59 98 93 94 98 100 79 83 61;]。
%X = X '。
%X = [2 0
-1.4。
%
2.2 0.2 -1.5。
%
2.4 0.1 -1。
%
1.9 0 -1.2;]。
%X = X '。
[A、B] =サイズ(X)。
M = SUM(X)/。
私は1 =について:B
B(:,i)=X(:,i)-M(i);
%B=zscore(X);
終わり
S = 1 /(a-1)B B '。
[ベクトル、値] = EIG(S)。
ベクター
値= DIAG(値)
varine = SUM(値)。
[value_sort、添字] =ソート(値、 '下降')。
value_sort;
添字;
value_sort = value_sort /和(value_sort)。
比較= 0;
記号= 0;
私は1 =について:B
if compare<0.9
sign=sign+1;
compare=compare+value_sort(i);
end
終わり
私は1 =について:看板
P(:,i)=vector(:,subscript(i));
終わり
P
D =ゼロ(符号、記号)。
私は1 =について:看板
D(i,i)=value(subscript(i));
終わり
D