第四章次元削減

EDITORIAL 0

これは、低次元で元の高次元の特徴ベクトルと呼ばれる次元削減を表します。一般的な次元削減方法は、主成分分析、線形判別分析、等長、局所線形埋め込み、ラプラシアン特徴マッピング、局所保存投影

 

01 PCA理論上の最大分散

Q1:どのようにメイン成分を定義するには?この定義から、どのような目的関数はベイダー成分を低減する主な目的を抽出するように設計するには?この目的関数のために、どのようにPCAの問題を解決するには?

A1:PCAは主成分データを見つけることを目的とし、次元削減の目的を達成するために、生データを特徴付けるこれらの主要コンポーネントを使用します。証明プロセスP75-77を参照してください。

 

02 PCA最小二乗誤差の理論

Q1:PCAは、それに応じてリターン目標の観点から、PCAの定義と問題が解決するかどうか、実際には最高の投影方向を解決し、それは目標が一致し、線形回帰で数学の問題である直線、ありますか?

A1:線形関数は、より良いサンプルセットを合わせて直線に対応するように、線形回帰問題が解決されます。この観点から、対象PCAの定義した場合、問題は回帰問題に変換されます。証明はP79-81を参照してください

 

03線形判別分析

LDAは、フィールドでの機械学習、データマイニングに基づく人気の古典的です。PCAと比較すると、LDAは、次元削減アルゴリズムの監督の一種として使用することができます。PCAでは、アルゴリズムは、タグデータ(カテゴリ)を考慮していませんが、元のデータは、唯一の大規模分散方向の一部にマッピングされます。

Q1:クラスラベルを持つデータについては、それが目的関数を設計する方法でなければなりませんが、情報のカテゴリを失うことなく、次元削減のプロセスを作りますか?この目標では、それが解決するためにどのようにすべきですか?

A1:分類のためのLDAは、最初のサービス、限りwを見つけるための投影方向となるように別のカテゴリとして、元の投影内のサンプル。

---- LDAベースの距離と最小距離クラスを最大の中心思想の間です。モデルが単純すぎるので、表現力は、いくつかの制限があり、我々は、より複雑なデータの配信を処理するためにカーネルLDA法の導入により拡張することができます。

 

主成分分析における04線形判別分析

Q1:次元削減アルゴリズムの古典としてLDAとPCA、どのようにアプリケーションの観点から、原則の類似点と相違点を分析するには?目的関数の接触との違いは、数学的な観点から導出されているどのような二次元削減アルゴリズム?

A1:ターゲットから出発して、PCAは、投影データの分散の方向の最大の選択であり、LDA選択はサブカテゴリ分散投影方向内のクラスとの間に大きな差異があります。

  アプリケーションの観点からは、基本的な原理は-----教師なしタスクの寸法を小さくするためにPCAを使用して把握することができ、LDAの適用を監督。

 

おすすめ

転載: www.cnblogs.com/guohaoblog/p/11210895.html
おすすめ