[Sklearn] ランダムフォレストアルゴリズムに基づくデータ分類予測(Excelでデータを直接置換可能)
1. モデル原理
ランダム フォレストは、複数のデシジョン ツリーを組み合わせて強力な分類モデルまたは回帰モデルを構築するアンサンブル学習方法です。ランダムフォレストのモデル原理と数学モデルは次のとおりです。
1.1 モデル原理
ランダム フォレストは、複数のデシジョン ツリーを組み合わせて予測の精度と堅牢性を向上させるアンサンブル学習方法です。各決定木は個別にトレーニングされ、それらの予測が結合されて最終的な予測が形成されます。ランダム フォレストの主なアイデアは、各ツリーが分類子であり、各分類子がデータのランダムなサブセットでトレーニングされる「フォレスト」を構築することです。予測時には、すべての分類器の結果が投票または平均によって結合されます。
ランダム フォレストの主な手順:
-
ランダム サンプリング (ブートストラップ サンプリング):元のトレーニング データから複数のサンプルをランダムに選択し、1 回のサンプリングで同じサンプルを複数回出現させることができます。