Python は、FA firefly 最適化アルゴリズムを実装して、ランダム フォレスト回帰モデル (RandomForestRegressor アルゴリズム) プロジェクトの実践を最適化します。

注: これは機械学習実践的なプロジェクトです (データ + コード + ドキュメント + が付属します)ビデオ説明)、データ + コード + ドキュメント + ビデオ説明が必要な場合は、最後まで直接進むことができます。記事の内容を確認してください。

1.项目背景

Fire-fly アルゴリズム (FA) は、2009 年にケンブリッジ大学のヤンによって提案されました。最新の群知能最適化アルゴリズムの 1 つであるこのアルゴリズムは、収束速度と収束精度が優れているという利点があり、工学への実装が容易です。

このプロジェクトは、FA ファイアフライ最適化アルゴリズムを使用して、ランダム フォレスト回帰モデルを最適化するための最適なパラメーター値を見つけます。

2.数据获取

今回のモデリングデータはインターネット上から取得したものです(作者作成) データ項目の統計は以下の通りです。

シリアルナンバー 

変数名

説明する

1

×1

2

×2

3

×3

4

×4

5

×5

6

×6

7

×7

8

x8

9

x9

10

×10

11

そして

従属変数

データ詳細は以下の通りです(一部表示)。

3.データの前処理

3.1 用Pandas工具查看数据

Pandas ツールの head() メソッドを使用して、データの最初の 5 行を表示します。

キーコード:

3.2 データが欠落しているビュー

データ情報を表示するには、Pandas ツールの info() メソッドを使用します。

     

上の図からわかるように、変数は合計 11 個あり、データには欠損値がなく、合計 2,000 個のデータがあります。

キーコード:  

3.3 数据描述性统计

Pandas ツールの description() メソッドを使用して、データの平均、標準偏差、最小値、分位数、および最大値を表示します。

キーコードは次のとおりです。    

4.探索的データ分析

4.1 y变量直方图

Matplotlib ツールの hist() メソッドを使用して、ヒストグラムを描画します。

上の図からわかるように、y 変数は主に -400 から 400 の間に集中しています。

4.2 相関分析

上図からわかるように、値が大きいほど相関が強く、正の値は正の相関、負の値は負の相関です。​  

5.特征工程

5.1 フィーチャ データとラベル データを作成する

キーコードは次のとおりです。

5.2 データセットの分割

train_test_split() メソッドは、トレーニング セットの 80% とテスト セットの 20% を分割するために使用されます。キー コードは次のとおりです。

6. ランダムフォレスト回帰モデルを最適化するための FA ホタル最適化アルゴリズムを構築する

FA ファイアフライ最適化アルゴリズムは、主にターゲット回帰のランダム フォレスト回帰アルゴリズムを最適化するために使用されます。

6.1 FA firefly 最適化アルゴリズムによって発見された最適なパラメータ   

最適なパラメータ:

   

6.2 最適なパラメータ値でモデルを構築する

シリアルナンバー

機種名

パラメータ

1

ランダムフォレスト回帰モデル

max_ Depth=best_max_ Depth

2

n_estimators=best_n_estimators

7.模型评估

7.1 評価指標と結果

評価指標には主に説明可能な分散値、平均絶対誤差、平均二乗誤差、R二乗値などが含まれます。

機種名

インジケーター名

指数値

テストセット

ランダムフォレスト回帰モデル

  Rスクエア

0.8773

平均二乗誤差

2856.772

説明された分散

0.8773

平均絶対誤差

41.0043

上の表からわかるように、R 二乗は 0.8773 であり、モデルの効果が良好であることを意味します。

キーコードは次のとおりです。

7.2 真値と予測値の比較表

上図から、実際の値と予測値の変動は基本的に一致しており、モデル フィッティング効果が良好であることがわかります。​​     

8.结论与展望

要約すると、この記事では、FA ファイアフライ最適化アルゴリズムを使用してランダム フォレスト回帰アルゴリズムの最適なパラメーター値を見つけて回帰モデルを構築し、最終的には提案したモデルがうまく機能することを証明します。このモデルは、日常の製品の予測に使用できます。

# 本次机器学习项目实战所需的资料,项目资源如下:
 
# 项目说明:

链接:https://pan.baidu.com/s/14M5y6f0jkmLBzHc7y6TBzg 
提取码:tyf5

より実践的なプロジェクトについては、実践的な機械学習プロジェクトのリストをご覧ください。

機械学習プロジェクト実践集リスト_機械学習実践プロジェクト_Pang Geの本当に良いブログ - CSDNブログ


 

おすすめ

転載: blog.csdn.net/weixin_42163563/article/details/134840167