機械学習の問題の一般的な考え方

#問題を定義します
はじめにライブラリやデータ、
データセットの二つのペアが薄く加工さ
3可視化データセットを確立
#データを理解します
これは、記述統計とデータの可視化によって観察されます
#データ準備
データの前処理、およびより良好な表示データの問題を行い、入力と出力との関係
1エラー重複データのスクリーニング
2特徴選択、フィーチャ属性と新機能のプロパティを追加する過剰を取り除きます
より良好なデータ分布を示すためにデータの調整または調整に3つのスケールデータ
#評価アルゴリズム
目的は、アルゴリズムの最適なサブセットを見つけることです
トレーニングセットを検証するために、評価データセットを分離
2演算モデルを評価するために使用されるモデル評価基準を定義します
線形および非線形アルゴリズムアルゴリズムのサンプルの3レビュー
4精度比較アルゴリズムは、このプロセスは、多くの時間を要します
最適化モデルの#
方法
パラメータ調整により、最適なパラメータを決定する1
2アルゴリズムのセットを介してモデルの精度を改善するため
#展開結果
1テストセットの検証最適化モデルを使用して
2データセット全体を通してモデルを生成します
新しいデータセットを予測するためにモデル序列3、


おすすめ

転載: www.cnblogs.com/sugar-k/p/11480353.html