注: これは機械学習実践的なプロジェクトです (データ + コード + ドキュメント + が付属します)ビデオ説明)、データ + コード + ドキュメント + ビデオ説明が必要な場合は、最後まで直接進むことができます。記事の内容を確認してください。
1.项目背景
Fire-fly アルゴリズム (FA) は、2009 年にケンブリッジ大学のヤンによって提案されました。最新の群知能最適化アルゴリズムの 1 つであるこのアルゴリズムは、収束速度と収束精度が優れているという利点があり、工学への実装が容易です。
このプロジェクトは、FA ファイアフライ最適化アルゴリズムを通じて LightGBM 分類モデルを最適化します。
2.数据获取
今回のモデリングデータはインターネット上から取得したものです(作者作成) データ項目の統計は以下の通りです。
シリアルナンバー |
変数名 |
説明する |
1 |
×1 |
|
2 |
×2 |
|
3 |
×3 |
|
4 |
×4 |
|
5 |
×5 |
|
6 |
×6 |
|
7 |
×7 |
|
8 |
x8 |
|
9 |
x9 |
|
10 |
×10 |
|
11 |
そして |
従属変数 |
データ詳細は以下の通りです(一部表示)。
3.データの前処理
3.1 用Pandas工具查看数据
Pandas ツールの head() メソッドを使用して、データの最初の 5 行を表示します。
キーコード:
3.2 データが欠落しているビュー
データ情報を表示するには、Pandas ツールの info() メソッドを使用します。
上の図からわかるように、変数は合計 11 個あり、データには欠損値がなく、合計 2,000 個のデータがあります。
キーコード:
3.3 数据描述性统计
Pandas ツールの description() メソッドを使用して、データの平均、標準偏差、最小値、分位数、および最大値を表示します。
キーコードは次のとおりです。
4.探索的データ分析
4.1 y变量柱状图
Matplotlib ツールの Lot() メソッドを使用して、ヒストグラムを描画します。
4.2 y=1 サンプル x1 変数分布ヒストグラム
Matplotlib ツールの hist() メソッドを使用して、ヒストグラムを描画します。
4.3 相关性分析
上図からわかるように、値が大きいほど相関が強く、正の値は正の相関、負の値は負の相関です。
5.特征工程
5.1 フィーチャ データとラベル データを作成する
キーコードは次のとおりです。
5.2 データセットの分割
train_test_split() メソッドは、トレーニング セットの 80% とテスト セットの 20% を分割するために使用されます。キー コードは次のとおりです。
6. FA ファイアフライ最適化アルゴリズムの構築 最適化LightGBM分類モデル
FA ホタル最適化アルゴリズムは、主に、ターゲット分類のための LightGBM 分類アルゴリズムを最適化するために使用されます。
6.1 FA Firefly 最適化アルゴリズムによる最適なパラメーター値の検索
最適なパラメータ:
6.2 最適なパラメータ値でモデルを構築する
シリアルナンバー |
機種名 |
パラメータ |
1 |
LightGBM 分類モデル |
n_estimators=best_n_estimators |
2 |
learning_rate=best_learning_rate |
7. モデルの評価
7.1 評価指標と結果
評価指標としては主に精度、精度、再現率、F1スコアなどが挙げられます。
機種名 |
インジケーター名 |
指数値 |
テストセット |
||
LightGBM 分類モデル |
正確さ |
0.9725 |
精度 |
0.9596 |
|
再現率 |
0.9907 |
|
F1スコア |
0.9749 |
上の表からわかるように、F1 スコアは 0.9749 であり、モデルが有効であることを示しています。
キーコードは次のとおりです。
7.2 分類レポート
上の図からわかるように、分類 0 の F1 スコアは 0.97、分類 1 の F1 スコアは 0.97 です。
7.3 混同行列
上の図からわかるように、実際には 0 であり、0 であると予測されないサンプルが 9 個あり、実際には 1 であり、1 であると予測されないサンプルが 2 個あります。全体的な予測精度は良好です。
8.结论与展望
要約すると、この論文では、FA ホタル最適化アルゴリズムを使用して、LightGBM アルゴリズムの最適なパラメーター値を見つけて分類モデルを構築し、最終的には提案したモデルがうまく機能することを証明します。このモデルは、日常の製品の予測に使用できます。
# 本次机器学习项目实战所需的资料,项目资源如下:
# 项目说明:
链接:https://pan.baidu.com/s/1KZMS8NSRdiALRDcbrRtHCw
提取码:yq1t
より実践的なプロジェクトについては、実践的な機械学習プロジェクトのリストをご覧ください。
機械学習プロジェクト実践集リスト_機械学習実践プロジェクト_Pang Geの本当に良いブログ - CSDNブログ