Python は FA firefly 最適化アルゴリズムを実装して、LightGBM 分類モデル (LGBMClassifier アルゴリズム) プロジェクトの実践を最適化します。

注: これは機械学習実践的なプロジェクトです (データ + コード + ドキュメント + が付属します)ビデオ説明)、データ + コード + ドキュメント + ビデオ説明が必要な場合は、最後まで直接進むことができます。記事の内容を確認してください。

1.项目背景

Fire-fly アルゴリズム (FA) は、2009 年にケンブリッジ大学のヤンによって提案されました。最新の群知能最適化アルゴリズムの 1 つであるこのアルゴリズムは、収束速度と収束精度が優れているという利点があり、工学への実装が容易です。

このプロジェクトは、FA ファイアフライ最適化アルゴリズムを通じて LightGBM 分類モデルを最適化します。

2.数据获取

今回のモデリングデータはインターネット上から取得したものです(作者作成) データ項目の統計は以下の通りです。

シリアルナンバー 

変数名

説明する

1

×1

2

×2

3

×3

4

×4

5

×5

6

×6

7

×7

8

x8

9

x9

10

×10

11

そして

従属変数

データ詳細は以下の通りです(一部表示)。

3.データの前処理

3.1 用Pandas工具查看数据

Pandas ツールの head() メソッドを使用して、データの最初の 5 行を表示します。

  

キーコード:

3.2 データが欠落しているビュー

データ情報を表示するには、Pandas ツールの info() メソッドを使用します。

       

上の図からわかるように、変数は合計 11 個あり、データには欠損値がなく、合計 2,000 個のデータがあります。

キーコード:  

3.3 数据描述性统计

Pandas ツールの description() メソッドを使用して、データの平均、標準偏差、最小値、分位数、および最大値を表示します。

  

キーコードは次のとおりです。    

4.探索的データ分析

4.1 y变量柱状图

Matplotlib ツールの Lot() メソッドを使用して、ヒストグラムを描画します。

4.2 y=1 サンプル x1 変数分布ヒストグラム

Matplotlib ツールの hist() メソッドを使用して、ヒストグラムを描画します。

4.3 相关性分析

上図からわかるように、値が大きいほど相関が強く、正の値は正の相関、負の値は負の相関です。​  

5.特征工程

5.1 フィーチャ データとラベル データを作成する

キーコードは次のとおりです。

5.2 データセットの分割

train_test_split() メソッドは、トレーニング セットの 80% とテスト セットの 20% を分割するために使用されます。キー コードは次のとおりです。

6. FA ファイアフライ最適化アルゴリズムの構築 最適化LightGBM分類モデル

FA ホタル最適化アルゴリズムは、主に、ターゲット分類のための LightGBM 分類アルゴリズムを最適化するために使用されます。

6.1 FA Firefly 最適化アルゴリズムによる最適なパラメーター値の検索   

最適なパラメータ:

   

6.2 最適なパラメータ値でモデルを構築する

シリアルナンバー

機種名

パラメータ

1

LightGBM 分類モデル

n_estimators=best_n_estimators

2

learning_rate=best_learning_rate 

7. モデルの評価

7.1 評価指標と結果

評価指標としては主に精度、精度、再現率、F1スコアなどが挙げられます。

機種名

インジケーター名

指数値

テストセット

LightGBM 分類モデル

正確さ

0.9725

精度

0.9596

再現率

0.9907

F1スコア

0.9749 

上の表からわかるように、F1 スコアは 0.9749 であり、モデルが有効であることを示しています。

キーコードは次のとおりです。  

7.2 分類レポート

     

上の図からわかるように、分類 0 の F1 スコアは 0.97、分類 1 の F1 スコアは 0.97 です。

7.3 混同行列

上の図からわかるように、実際には 0 であり、0 であると予測されないサンプルが 9 個あり、実際には 1 であり、1 であると予測されないサンプルが 2 個あります。全体的な予測精度は良好です。​    

8.结论与展望

要約すると、この論文では、FA ホタル最適化アルゴリズムを使用して、LightGBM アルゴリズムの最適なパラメーター値を見つけて分類モデルを構築し、最終的には提案したモデルがうまく機能することを証明します。このモデルは、日常の製品の予測に使用できます。​ 

# 本次机器学习项目实战所需的资料,项目资源如下:
 
# 项目说明:

链接:https://pan.baidu.com/s/1KZMS8NSRdiALRDcbrRtHCw 
提取码:yq1t

より実践的なプロジェクトについては、実践的な機械学習プロジェクトのリストをご覧ください。

機械学習プロジェクト実践集リスト_機械学習実践プロジェクト_Pang Geの本当に良いブログ - CSDNブログ


 

おすすめ

転載: blog.csdn.net/weixin_42163563/article/details/134840698