Scikit-学ぶ--- 5.クラスタリングモデル

(A)一般的なメソッドのパラメータ

1.一般的な手順

  • get_params([deep]):モデルのパラメータを返します。

    • deep:場合はTrue、子オブジェクトモデルパラメータを返すことができます。
  • set_params(**params):モデルのパラメータ。

    • params:キーワードのパラメータが設定されます。
  • fit(X[, y, sample_weight]) :トレーニングモデル。

    • X:サンプルセット。典型的にはnumpy array、各行はサンプルを表し、各列が一つの特徴を表しています。
    • y:ラベルのサンプル収集。それとX各行に相当します。
    • sample_weight:サンプル重量の。その形状は[n_samples,]、各要素はサンプルの重量を表します。
  • predict(X, sample_weight):各サンプルが属するクラスタのラベルを返します。

    • X:サンプルセット。典型的にはnumpy array、各行はサンプルを表し、各列が一つの特徴を表しています。
    • sample_weight:サンプル重量の。その形状は[n_samples,]、各要素はサンプルの重量を表します。
  • fit_predict(X[, y, sample_weight]) :トレーニングモデルと各サンプルが属するラベルクラスタのクラスタ、リターンを実装します。

    • X:サンプルセット。典型的にはnumpy array、各行はサンプルを表し、各列が一つの特徴を表しています。
    • y:ラベルのサンプル収集。それとX各行に相当します。
    • sample_weight:サンプル重量の。その形状は[n_samples,]、各要素はサンプルの重量を表します。
  • transform(X):データセット  X への切り替えcluster center space 。

    cluster center space 寸法、試料は、各クラスタの中心からの距離です。

    • X:サンプルセット。典型的にはnumpy array、各行はサンプルを表し、各列が一つの特徴を表しています。
  • fit_transform(X[, y, sample_weight]):トレーニングモデルとクラスタリングの実装、データセット  X への切り替えcluster center space 。

    • X:サンプルセット。典型的にはnumpy array、各行はサンプルを表し、各列が一つの特徴を表しています。
    • y:ラベルのサンプル収集。それとX各行に相当します。
    • sample_weight:サンプル重量の。その形状は[n_samples,]、各要素はサンプルの重量を表します。

2.通用参数

  • n_jobs:正の数、および指定されたフォーム、指定タスク  CPUの数を。

    もし  -1 あなたがすべての利用可能なを使用します  CPU

  • verbose:正の数。開口部のための/中間の反復出力ログ関数を閉じます。

    • 値が大きいほど、より多くのログを詳細に説明しました。
    • 0またはの値None無効ログ出力。
  • max_iter :反復の最大数を指定する整数。

    場合はNone、デフォルト値(異なると比べてsolver異なるデフォルト値)。

  • tol:浮動小数点数は、閾値アルゴリズムの収束を指定します。

  • random_state:整数またはRandomStateインスタンス、またはNone

    • 整数の場合は、乱数シードジェネレータを指定します。
    • 場合RandomStateの例は、乱数ジェネレータを指定します。
    • それがある場合はNone、デフォルトの乱数発生器。

A、関数kmeans

二、DBSCAN

三、MeanShift

四、AgglomerativeClustering

五、BIRCH

六、GaussianMixture

七、SpectralClustering

おすすめ

転載: www.cnblogs.com/nxf-rabbit75/p/12109346.html