LogisticRegression と LogisticRegressionCV の違い

LogisticRegression と LogisticRegressionCV は、scikit-learn ライブラリでロジスティック回帰に使用される 2 つのクラスであり、両者の違いは次のとおりです。

1、ロジスティック回帰

LogisticRegression は、二値または多分類の問題に使用されるロジスティック回帰モデルです。さまざまな最適化アルゴリズム (準ニュートン法、座標降下法など) を使用して、ロジスティック回帰モデルを当てはめることができます。正則化項 (L1 正則化または L2 正則化) は、モデルの複雑さを制御するために必要に応じて設定できます。モデルのパフォーマンスは、ハイパーパラメーター (正則化の強度、最適化アルゴリズムなど) を調整することで改善できます。
サンプルコード:

from sklearn.linear_model import LogisticRegression

lr = LogisticRegression()
lr.fit(X, y)

2、ロジスティック回帰CV

LogisticRegressionCV は、最適な正則化強度を自動的に選択するために使用される交差検証ベースのロジスティック回帰モデルです。フィッティング プロセス中に、相互検証を実行してさまざまな正則化強度のパフォーマンスを評価し、最もパフォーマンスの高い正則化強度を選択します。
試行する正則化強度値の範囲と、相互検証のフォールド数を指定できます。自動的に選択された最適な正則化強度は、LogisticRegressionCV オブジェクトの C_ 属性を通じて取得できます。
サンプルコード:

from sklearn.linear_model import LogisticRegressionCV

lr_cv = LogisticRegressionCV(cv=5)
lr_cv.fit(X, y)
best_C = lr_cv.C_

3. まとめ

LogisticRegression は、ロジスティック回帰モデルを適合させ、ハイパーパラメーターを手動で調整するために使用されます。LogisticRegressionCV は、ハイパーパラメーターを手動で調整することなく、相互検証に基づいて最適な正則化強度を自動的に選択します。

ニーズに応じて、いずれかを選択して使用できます。正則化の強度やその他のハイパーパラメータを手動で調整したい場合は、LogisticRegression を使用できます。最適な正則化強度を自動的に選択し、相互検証を実行してモデルのパフォーマンスを向上させたい場合は、LogisticRegressionCV を使用できます。

おすすめ

転載: blog.csdn.net/m0_37738114/article/details/133563812