カテゴリー階層的クラスタリング
- 階層的クラスタリングを集約:ボトムアップから、クラスタに結合するまで、クラスタとして各オブジェクトに、下から上に、同様のクラスタが併合しました
- 階層的クラスタリング分類:トップダウン、クラスタまでの全ての点、各分割クラスタを含むクラスタから出発して、単一の点を残し
クラスタ間の結束
単鎖:
定義:二つのクラスタの中の任意の2点間の最短距離として隣接の二つのクラスタ
式:DIST({M1、M2} 、{M3、M4})=分(DIST {M1、 M3}、DIST {M1、M4 }、DIST {M2、M3}、DIST {M2、M4})
特徴:良い技術の一本鎖の非楕円形の処理クラスタを、ノイズ及び異常値に極めて敏感。
完全なチェーン:
定義:二つのクラスタの近接性は、2つのクラスタの中の任意の2点間の最長の距離である
式:DIST({M1、M2} 、{M3、M4})= MAX(DIST {M1 、M3}、DIST {M1、 M4}、DIST {M2、M3}、DIST {M2、M4})
特徴:良好な加工チェーン技術円形のクラスタを、ノイズ及び異常値の影響を受けにくいです。
平均グループ:
定義:2つのクラスターの近接は二つのクラスタの中の任意の2点間の平均距離である
式:DIST({M1、M2} 、{M3、M4})=(DIST {M1、M3 } + DIST {M1、M4} + DIST {M2、M3} + DIST {M2、M4})
4
アルゴリズムのアイデア:
入力:n個のオブジェクト、クラスタkの終了条件の数
出力:K個のクラスタは、クラスタの数が所定の終了条件に到達します
- すべては最初のクラスタとしてオブジェクト
- 始めるん(;; I≠K iを++ iは1を=)のための
- 選択されたクラスタCは、すべてのクラスタ内の最大直径を有します
- 古い党に残っている、分派グループに点PとPに最大の平均非類似度を持つ他の点Cを探します
- 繰り返す
- 古い党との点で最も近い点からの距離よりも大きくないポイントに分派古い党の最も近い点を見つけるために、追加された分派
- 新しいノードがspilnterグループに古い党を割り当てられなくなるまで
- spilnterグループ古い党とは、他のクラスタセットで新しいクラスタのクラスタを選択した二つのクラスタに分割され
- 終了
階層的クラスタリングアルゴリズムは、一般的にあまり使用を割りました。