クラスタリングアルゴリズムの開始前に、仕上げ - パート00

始めます

これに先立ち、再び記録を作成する方法のメモに複数のクラスタリング方法を書きました。

A、K平均クラスタリング

:k平均クラスタリングは、以下のようにプロセスが一般的に最も単純なクラスタである
①分類番号kによれば、kは最初のランダムセンターを得ました。
②最近の中心がドアの下割り当てされた各クラスタkの中心のサンプルを得ました。
③各クラスのクラスタは、新しいセンターで最大/ minを取る、各サンプルおよび他のすべてのサンプルの距離を求めます。
④②③プロセスサイクル条件までサイクル、BREAK
⑤方法の品質を評価するためのベンチマーク。
問題が発生することがあります。
まず、問題の中心を選択し、ランダムなものの、効率を維持するために、ランダムに初めて、より良い評価の裏に応じて中心から外れランダムGETの代わりに選択することができます。分類クラスタを計画する際に、異なる方法が異なる治療が、具体的な方法は、同じ式から、設定されなければなりません。サイクリング条件、サイクルの一部の特定の数のように、一部の計画は、クラスタの分類方法を変更する場合は...多くあります参照してください。

二、TCMクラスタリング(スリーウェイC-手段)

TCMは、やや複雑な方法であることを理解することは困難ではありません。
部門の中心を定義し、クラスクラスタのその特別な場所。
次のように具体的なプロセスである:
1、最初の距離に応じて分割する第一のクラスのクラスタを行い、次に、実現ランダム化。
2の中心定義
:最初の4つの式を定義
B
と仮定X1〜XN、n個のサンプル、K = 3。
サンプルの各セットはBであった、Bは、サンプルが(正とドメインとドメイン境界を含む)クラスに属する含みます。ここでB、少数以下同じの性質を説明するために、より行いません。
、μ
ここに画像を挿入説明
PS:Cは、中心の数を示す1⩽I⩽C、1 ⩽J⩽N、dは距離を表し、Dijとが属し、mがよりパラメータ大きいまたは1に等しい、入力値をD(CI、Xjの)を表します。
最終的に得られたμK×N行列を
M
Mは、行列Bとμから取得された場合BXJ = {1,3}、次いでMXJ = {μ1j、μ3j}。
= +Μ3jμ1jΣMxj
Wであり
、Wは、まず第一に、K×N行列である
WIJ:
もし| Bijの| = 0またはI Bijの要素は、WIJ = 0属しません。
場合| Bijの|> 1とiは要素Bijの、そしてWIJ =μij/ΣMxjが属しています。
要素Bijの場合、Wijを= 1属し= 1とI | Bijの|の場合。

综合上面的部分,可以得到中心,如下:
mi = ∑正同域中的xj*wij / ∑正同域的wij

図3に示すように、指定された分類クラスタ
R&LT、F、G、L
Rijの=μij、
FJ = MAX(μ1j、μ2j,,μcj...)、
値Gij = F(Rijの、FJ)、(G = K×N行列、F関係(x、y)のxyがあってもよい+、 - 、×、/)
Lijの= F(値Gij、£)の、(£パラメータは、G L 0-1にセクタの£に特異的であり得るように行列、F(x、y)は、>、> =、<、<=)であることができる
£、式の定義、自己検査:PS。

距離v(MI、XJ)=値Gijを定義 (:、j)は(PS:/和μについても同様の式)
IF V(miザ、XJを)> =α:正同ドメイン
のelifβ<= V(MIをXJ)<α:境界領域
他:陰性抗ドメイン
α、ベータ]
。[α= 1、£=ベータ] / SUM(:、J)
PS:βは固定パラメータではありません

だから、反復プロセス...もっと

三、KWMクラスタリング(K-マルチ加重モード)

サンプル特徴:これは、多次元クラスタリングサンプル、複数のレコードを含む試料、複数の属性を含むレコードです。

1、ACDM距離アルゴリズムは、
ここで例に直接式を解釈しない:
ここに画像を挿入説明
二つの試料上、(X1、X2)Dを見つける
D(X1、X2)= 1/2シグマ£(X1A1、グラウンド)
のX1に対して、X2 A1例:
S = 0
、U = {8,5,7,3,1}(及びセット)
U-Iにおける場合:
。。S + = | 1 / 3-1 / 4 |(= I. 8)
最終Dを得ることができます( X1、X2)
2は、中央アルゴリズム
この方法は、2つの中央アルゴリズム、それぞれHAFMWM、GAFMWMを含みます

方法 機能
HAFMWM 低精度、計算速度
GAFMWM 高精度・低速度

:ここでのみHAFMWMアルゴリズムは以下の通りである提供
V = 0の定義、INPUT:マイクロ
各カテゴリクラスタ内には①、新しいセンター、分の各によって分撮影された全ての他のサンプルと、各サンプルの距離を求めます。距離Wを加算しました
②裁判官| WV |μとの関係は、前者はループの小さなうち、そうでない場合はW-> Vと次のサイクルに転送されます。

リリース6元記事 ウォンの賞賛0 ビュー71

おすすめ

転載: blog.csdn.net/qq_44851357/article/details/105032092