「機械学習」スイカブックIXクラスタリング(b)のプロトタイプクラスタリング、密度のクラスタリング、階層的クラスタリング

次のセクションでは、いくつかのクラスタリングアルゴリズムを導入しました。

9.4プロトタイプのクラスタリング

「プロトタイプベースのクラスタリング」アルゴリズムとして知られているクラスタリングプロトタイプのセットを介してそのようなクラスター構造をとるプロトタイプ実際にクラスタリングタスクは非常に一般的である、特徴付け。通常の状況下では、アルゴリズムは最初のプロトタイプ、プロトタイプを初期化し、反復更新解決しました。

9.4.1 k平均アルゴリズム

すべての可能な限り互いに類似し、同じクラスタが異なるクラスタ間で互いに類似しないようにしようように、このアルゴリズムでは、我々は、k個のクラスタにすべてのアイテムを置きます。

所与のサンプル集合D = {X1、X2、... 、XM}、K C = {C1、C2、...、結果として得られるクラスタ分割する平均クラスタリングアルゴリズム Ckが} 二乗誤差を最小に

 

これベクター、ビューの直感的な点、ある程度の平均ベクトルの周りにクラスタサンプルクラスタの近さを特徴付ける、Eの値が小さいクラスタは高い類似性があるサンプルクラスタCI平均です。

 

k平均アルゴリズムを介して、貪欲な戦略を使用し、反復最適化近似式を解決します。

アルゴリズムステップ:平均ベクトルを初期化するために専用の最初のテストkが「平均」、ランダムデータ・フィールドを生成するステップと、最寄りの平均に2は、各観察用の相関によって作成されたK個のクラスタ3は、それぞれ新しい平均ベクトルを計算します...収束するまで前記繰り返しステップ23、すなわち無現在更新された平均ベクトル、クラスタの重心は、新しい平均値となります。

 

 9.4.2学習ベクトル量子化

(LVQと呼ぶ)、「学習ベクトル量子化」はまた、クラスタの構造を特徴づけるためにプロトタイプベクトルのセットを見つけようとしているが、一般的なクラスタリングアルゴリズムが異なる、LVQを有するデータサンプルと仮定カテゴリタグは、学習処理サンプルの使用は、そのような監視情報を助けるためにクラスタリング。

サンプルの所与のセット、nは説明の属性ベクトルである各サンプルXJは、YIはLVQのゴール、サンプルXJカテゴリタグであるn次元プロトタイプベクトル{P1、P2、...、PQのセットを学習することです } ,,各プロトタイプベクトルがクラスタのクラスタを表します。

 

 アルゴリズム・ステップ:1.プロトタイプベクトル初期のTからq番目のクラスタのカテゴリを標識することができるq個のサンプルを無作為にプロトタイプベクトルとして選択しました。ベクター2.プロトタイプ反復最適化は、各ラウンドの反復において、最も近いプロトタイプベクトルを識別し、二つのカテゴリーに係るプロトタイプベクトルに適切な更新を行うようにマークをトレーニングアルゴリズムランダムに選択された試料は同じです:最寄りのプロトタイプベクトルパイ* XJとラベルが同じであれば、注文Pは、私が Xに* J新しいプロトタイプベクトルとして、近い方向今回

 

そして、p`のXJとの間の距離である学習率(0,1)の一部が更新p`のXJの後に近くなるので、; PI * XJのカテゴリタグが同じでない場合は同様に、その後、プロトタイプベクトルがで更新されますXJの間の距離が増加する離れるXから一層J前記停止条件が成立したアルゴリズム(例えば、反復の最大数に達した、または小さなプロトタイプベクトルの更新が更新されていない)、現在のプロトタイプベクトルを最終結果として返されていた場合。

9.4.3ガウス混合のクラスタリング

そしてLVQプロトタイプベクトルのk手段は、ガウス混合使用して異なるクラスタ、クラスタの構造について説明するための確率モデルクラスタリングプロトタイプを発現します。

 

おすすめ

転載: www.cnblogs.com/ttzz/p/11653380.html