機械学習プロジェクトのプロセスを完了します

数学の問題に抽象化1

問題は明らかに機械学習の最初のステップです。トレーニング機械学習プロセスは通常、非常に時間のかかるもので、ランダムな時間コストが非常に高いですしてみてください。

ここでの数学の問題に抽象、明らかに我々が得ることができるデータの種類を参照して、抽象的問題は、回帰または分類やクラスタリング問題です。

2取得データ

データは機械学習成果の上限を決定し、アルゴリズムはちょうど、可能な限り、この限界に近づい。

代表されるデータは、確かにオーバーフィッティングになります。

そして、分類のために、データの偏りがあまりにも厳しいことはできません、異なるタイプのデータの数は、大きさの差の順序を持​​っていません。

しかし、また、評価があり、どのように多くのサンプル、データの順序の機能の数は、手放すかどうかを判断するためのメモリ消費量、メモリトレーニングプロセスの範囲を推定することができます。あなたが考慮しなければならない場合は改善アルゴリズムは、フィットや次元削減技術の一部を使用しません。データの量が多すぎると、それは分散を考慮しなければなりません。

3前記前処理および特徴選択

良いデータが実際に役割を果たすことができる優れた特徴を抽出することができるようにします。

前記洗浄工程の前処理、データが重要であり、そして多くの場合、アルゴリズムの性能の効果が大幅に改善されます。などの正規化、離散化、因数分解、欠損値は、共線、データマイニングプロセスを削除し、それらに多くの時間を費やしました。仕事は、簡単な、再現性のある安定した予測利益である基本的なステップの機械学習の基礎です。

顕著な特徴をスクリーニング、非顕著な特徴を取り除く、あなたは繰り返しビジネス機械学習技術を理解する必要があります。これは、多くの結果に決定的な影響を持っています。特徴選択さて、非常に単純なアルゴリズムが良好で安定した結果を得ることができます。これは、相関係数、カイ二乗検定、平均相互情報、エントロピー条件、事後確率、加重ロジスティック回帰法として、関連する技術解析機能の有効、の使用を必要とします。

4トレーニングモデルとチューニング

我々は、アルゴリズムの訓練の上に言ったまで、このステップにのみ使用されます。今では多くのアルゴリズムが、ヒトでの使用のためにブラックボックスの中にカプセル化することができます。しかし、本当のテスト結果は、より優れたものになるように、これらのアルゴリズム(スーパー)のパラメータのレベルを調整することです。これは、アルゴリズムの原則の深い理解を持っている私たちを必要とします。より深い理解、より多くのあなたは、問題の核心を見つける良いチューニングプログラムを提案することができます。

5診断モデル

方向それのアイデアを曲のモデルを決定するには?これは、モデルの技術的な診断が必要です。

オーバーフィッティング、診断を決定するためにアンダーフィッティングモデルは重要なステップです。こうした相互検証学習曲線の描画などの一般的な方法。基本的な考え方を調整することは、モデルの複雑さを軽減、オーバーフィッティングデータの量を増やすことです。チューニングの基本的な考え方をUnderfittingは、モデルの複雑さを増加させ、量と質の特性を向上させることです。

エラー解析ステップはまた、機械学習に重要です。エラーサンプル観察することによって、エラーの原因の包括的な分析:問題や課題アルゴリズム選択のパラメータは、問題の特徴であるか、データ自体に疑問を......

モデル診断は、これは一定の近似の反復プロセスで、チューニングするために再チューニング診断する必要の新しいモデルを必要とする、私たちはこのように、最適な状態を達成し、しようとし続ける必要があります。

Fusionの6モデル

一般的には、統合のモデルの後に特定することの効果を高めることができます。そして、それはうまく動作します。

エンジニアリングは、主にアルゴリズムの精度を高めるために(洗浄及び前処理特性、異なるサンプリングモード)モデルの前端に後端(モデルのマージ)にある努力の方法です。彼らは比較的標準コピーすることができるため、効果が比較的安定しています。直接パラメータ調整は結局、遅すぎるまで訓練を受け、大量のデータを多くの作業ではありませんが、その効果は保証することは困難です。

7ライン上で実行されています

この部分は主に、実装が比較的大きいプロジェクトに関連しています。オンラインのモデルを実行しているの影響は直接モデルの成否を判断し、結果指向の技術です。単純にさらに動作速度(時間計算)を含む等精度、誤差のインスタンス度を備えていない、リソース(空間的複雑さ)消費、安定度が許容されます。

これらのワークフローは、主に技術的手法でいくつかの経験を総括しています。必ずしもすべてのプロジェクトは完全なプロセスが含まれています。ここでは、ガイドの指示のほんの一部であり、我々はより多くの練習を所有している場合にのみ、より多く蓄積されたプロジェクトの経験、自分自身のより深い理解を持つことになります。

おすすめ

転載: www.cnblogs.com/xin-qing3/p/11410288.html