注: これは機械学習実践的なプロジェクトです (データ + コード + ドキュメント + が付属します)ビデオ説明)、データ + コード + ドキュメント + ビデオ説明が必要な場合は、最後まで直接進むことができます。記事の内容を確認してください。
1.项目背景
Fire-fly アルゴリズム (FA) は、2009 年にケンブリッジ大学のヤンによって提案されました。最新の群知能最適化アルゴリズムの 1 つであるこのアルゴリズムは、収束速度と収束精度が優れているという利点があり、工学への実装が容易です。
このプロジェクトは、FA ファイアフライ最適化アルゴリズムを使用して、ランダム フォレスト回帰モデルを最適化するための最適なパラメーター値を見つけます。
2.数据获取
今回のモデリングデータはインターネット上から取得したものです(作者作成) データ項目の統計は以下の通りです。
シリアルナンバー |
変数名 |
説明する |
1 |
×1 |
|
2 |
×2 |
|
3 |
×3 |
|
4 |
×4 |
|
5 |
×5 |
|
6 |
×6 |
|
7 |
×7 |
|
8 |
x8 |
|
9 |
x9 |
|
10 |
×10 |
|
11 |
そして |
従属変数 |
データ詳細は以下の通りです(一部表示)。
3.データの前処理
3.1 用Pandas工具查看数据
Pandas ツールの head() メソッドを使用して、データの最初の 5 行を表示します。
キーコード:
3.2 データが欠落しているビュー
データ情報を表示するには、Pandas ツールの info() メソッドを使用します。
上の図からわかるように、変数は合計 11 個あり、データには欠損値がなく、合計 2,000 個のデータがあります。
キーコード:
3.3 数据描述性统计
Pandas ツールの description() メソッドを使用して、データの平均、標準偏差、最小値、分位数、および最大値を表示します。
キーコードは次のとおりです。
4.探索的データ分析
4.1 y变量直方图
Matplotlib ツールの hist() メソッドを使用して、ヒストグラムを描画します。
上の図からわかるように、y 変数は主に -400 から 400 の間に集中しています。
4.2 相関分析
上図からわかるように、値が大きいほど相関が強く、正の値は正の相関、負の値は負の相関です。
5.特征工程
5.1 フィーチャ データとラベル データを作成する
キーコードは次のとおりです。
5.2 データセットの分割
train_test_split() メソッドは、トレーニング セットの 80% とテスト セットの 20% を分割するために使用されます。キー コードは次のとおりです。
6. ランダムフォレスト回帰モデルを最適化するための FA ホタル最適化アルゴリズムを構築する
FA ファイアフライ最適化アルゴリズムは、主にターゲット回帰のランダム フォレスト回帰アルゴリズムを最適化するために使用されます。
6.1 FA firefly 最適化アルゴリズムによって発見された最適なパラメータ
最適なパラメータ:
6.2 最適なパラメータ値でモデルを構築する
シリアルナンバー |
機種名 |
パラメータ |
1 |
ランダムフォレスト回帰モデル |
max_ Depth=best_max_ Depth |
2 |
n_estimators=best_n_estimators |
7.模型评估
7.1 評価指標と結果
評価指標には主に説明可能な分散値、平均絶対誤差、平均二乗誤差、R二乗値などが含まれます。
機種名 |
インジケーター名 |
指数値 |
テストセット |
||
ランダムフォレスト回帰モデル |
Rスクエア |
0.8773 |
平均二乗誤差 |
2856.772 |
|
説明された分散 |
0.8773 |
|
平均絶対誤差 |
41.0043 |
上の表からわかるように、R 二乗は 0.8773 であり、モデルの効果が良好であることを意味します。
キーコードは次のとおりです。
7.2 真値と予測値の比較表
上図から、実際の値と予測値の変動は基本的に一致しており、モデル フィッティング効果が良好であることがわかります。
8.结论与展望
要約すると、この記事では、FA ファイアフライ最適化アルゴリズムを使用してランダム フォレスト回帰アルゴリズムの最適なパラメーター値を見つけて回帰モデルを構築し、最終的には提案したモデルがうまく機能することを証明します。このモデルは、日常の製品の予測に使用できます。
# 本次机器学习项目实战所需的资料,项目资源如下:
# 项目说明:
链接:https://pan.baidu.com/s/14M5y6f0jkmLBzHc7y6TBzg
提取码:tyf5
より実践的なプロジェクトについては、実践的な機械学習プロジェクトのリストをご覧ください。
機械学習プロジェクト実践集リスト_機械学習実践プロジェクト_Pang Geの本当に良いブログ - CSDNブログ