機械学習の基礎:「分類アルゴリズム (1) - sklearn コンバーターと推定器」

1. コンバーター

1. コンバータとは何ですか?
特徴量エンジニアリングの前のステップ:
(1) 最初のステップは、コンバータ クラス (Transformer) をインスタンス化することです.
(2) 2 番目のステップは、fit_transform を呼び出してデータを変換することです。

2. 特徴量エンジニアリングのインターフェイスをコンバーターと呼びます。コンバーター呼び出しにはいくつかの形式があります。
fit_transform()、
fit()、
transform()

3. 例
標準化の例を見てみましょう: (x - 平均) / std
変換される特徴 x は、この列の平均値から減算され、標準偏差で除算されます。
最初のステップでは、fit() を実行して、各列の平均、標準偏差
2 番目のステップでは、transform() が実行され、最初のステップで計算された結果を使用して、最終変換の式に取り込まれます。

2. 推定者

1. エスティメーターとは何ですか?
sklearn では、エスティメーターは重要な役割を果たします。アルゴリズムを実装する API の一種であり、
すべての機械学習アルゴリズムはエスティメーターにカプセル化されています。

2. 分類のための推定器
(1) sklearn.neighbors: k-neighborアルゴリズム
(2) sklearn.naive_bayes: 単純ベイズ
(3) sklearn.linear_model.LogisticRegression: ロジスティック回帰
(4) sklearn.tree: ランダムフォレストを使用した決定木

3. 回帰に使用する推定量
(1) sklearn.linear_model.LinearRegression: 線形回帰
(2) sklearn.linear_model.Ridge: リッジ回帰

4. 教師なし学習の推定器
(1) sklearn.cluster.KMeans: クラスタリング

3. 推定ワークフロー

1. エスティメーターをインスタンス化する

2. estimator.fit(x_train, y_train) を呼び出して計算し
、fit メソッドにトレーニングセットの特性値と目標値を渡します。
呼び出しが完了すると、モデルが生成されたことになります。

3. モデルの評価
(1) 真の値と予測値を直接比較 注
: x_test テストセット、y_predict 予測結果、y_test テストセット目標値
y_predict = estimator.predict(x_test)
比較 y_test == y_predict

(2) 精度の計算
説明: 精度 precision
= estimator.score(x_test, y_test)

おすすめ

転載: blog.csdn.net/csj50/article/details/132302678