(テキストを含む)、大量のデータから掘るの暗黙的な、未知の、これらの法律の意思決定支援や知識のための意思決定の関係、モデルやトレンド、およびモデルのための潜在的に有用な、予測意思決定支援方法を提供し、ツールとそのデータマイニングを処理します。それは、独自のルールを見つけて、大量のデータでモデルとデータの関係を発見する分析さまざまなツールを使用して、包括的な統計、データベース技術と人工知能技術。
1.データマイニングの基本的なタスク
データマイニングの基本的なタスクは、分類と予測、クラスタリング、アソシエーションルール、シーケンスモード、偏差検出、インテリジェントな勧告と含まれているデータのビジネス価値を引き出す手助けする他の方法の使用を含みます。
2.データマイニングモデリングプロセス
- マイニングの目標の定義
- データサンプリング
- データ探索
- データの前処理
- マイニングモデル
- モデル評価
- 目標は単に鉱業(関連する背景、明確なユーザーのニーズの確認対象、ドメイン知識と理解を)定義されています。
- データサンプリング:データマイニング対象のサブセットに関連したビジネスシステムからサンプルを抽出する必要性を採掘目標をクリアし、(基準:関連性、信頼性、妥当性、完全性[ないすべてのデータ])、テストデータの品質(メジャー:完全な情報を示す完全で正確なデータのない異常値)。サンプリングデータ抽出方法(を含むがこれらに限定されない:ランダムサンプリング、系統的サンプリング、層化サンプリングは、出発配列からサンプリング、サンプルの分類)。
- データ調査は:異常値(離散値、等)分析、欠損値分析、相関分析、周期性分析が挙げられます。
- データ前処理:データのフィルタリング、データ変数変換、削除処理の異常値、不良データの処理、データの正規化、主成分分析、属性選択、データプロトコル、など次元削減。
- マイニングモデル:( 1つ以上のアルゴリズムがモデルにする等の分類、クラスタリング、アソシエーションルール、シーケンスモードまたはインテリジェント勧告)
- モデル評価は:結果に基づいて、解釈し、適用する最適なモデルを選択してください。
3.一般的なデータマイニングモデリングツール
- パイソン
- KEEP