[]データ解析研究ノートのday19クラスタモデル - K-means法モデルの導入をクラスタリング+ + K平均+ K平均アルゴリズム+ + +アルゴリズムアルゴリズム思想の長所と短所を説明

クラスタリングモデル:K-手段

  • クラスタリング(クラスタリング)は、教師なし学習(教師なし学習)に属しています
  • クラスレスマーク
  • オンラインデモ:http://syskall.com/kmeans.js

[画像のダンプはチェーンが失敗し、発信局は、直接アップロード(IMG-XddDyvEu-1579958309751)(../画像/ K-Means.png)ダウン画像を保存することが推奨され、セキュリティチェーン機構を有していてもよいです]

K平均アルゴリズム

  • 10古典的なデータマイニングアルゴリズムの一つ
  • アルゴリズムは、パラメータKを受信し、K個のクラスタに、サンプル点、高類似度の同じクラスタのサンプル、より小さな類似の異なるクラスターのサンプル

アルゴリズムのアイデア:

最も近いサンプル点の分類の中心とクラスタk番目の時点での空間。反復法により、増分好ましくはクラスタリング結果になるまで、各クラスタ中心を更新します

アルゴリズムの説明:

  1. kの初期クラスタ中心を選択します
  2. n回目の反復では、任意のサンプル点は、k個のクラスタ中心までの距離を見つけ、サンプル点が配置されているクラスタの中心から最小距離に分類され
  3. センターの様々なタイプの平均値を更新するために他の方法を使用します
  4. すべてのk個のクラスタセンターの、安定性を達成するために、反復端を反復更新ステップ2および3を使用する場合。

長所と短所:

  • 利点:速い、簡単な
  • 短所:初期点を選択し、最終的な結果は、局所最適に陥るに関連して、kの所定の値について所望の
彼は192元の記事を発表 ウォン称賛56 ビュー10000 +

おすすめ

転載: blog.csdn.net/qq_35456045/article/details/104084863