(R言語に基づく)機械学習と-K-手段クラスタリングアルゴリズム

K平均クラスタリング

n個の観測値は、k個のクラスタに分類し、特定の基準(類似のデータ点)、(分割されたユーザ、製品カテゴリ、等)に応じて、ポイント。

主要コンセプト:重心

K平均クラスタリング変数の距離を計算しやすい数値変数要件です。

 

アルゴリズム

 

R言語

 K平均アルゴリズムは、距離値に変換され、距離測定のクラスタリングされています。いいえ正規化は、距離が非常に遠く離れて作るんだろう。

補足:重要性の尺度の正規化

こうした違いの年齢や収入値として、2つの変数間の数値に大きな違いは非常に充実しています。

ステップ

クラスタの数、すなわち、kの値を決定する最初のステップ

方法:肘のルール+実際のビジネス・ニーズ

第二段階は、K-means法のモデルを実行します

第3のステップは、クラスタモデルの結果を要約します

 

おすすめ

転載: www.cnblogs.com/Grayling/p/10991252.html