(CRISP-DM)の科学探査のデータフロー

CRISP-DM(データマイニングのためのクロス産業プロセス)モデルKDDプロジェクトプロセスの完全な説明である提供します。モデルは、KDDプロジェクトが異なる6分割されているが、順序は完全に同じステージではないであろう。

  1. ビジネスの理解(事業概要)

    この最初の段階では、プロジェクトと究極の目標の要件が何であるかをビジネスの観点から理解する必要があり、定義やデータマイニングの結果とこれらの目標を結合します。

  2. (データの理解)感謝のデータ

    主な仕事は含まれています:決定ビジネス目標、発見の結果に影響を与える重要な要因を、ビジネスの観点から、主なターゲット顧客を描く、状況を評価し、すべてのリソースを見つけ、制限は想定して、データを分析する際に様々なプログラムの目標やプロジェクトを決定するために考慮しますなどのリスクや事故、関連用語、費用と便益、など、他の要因は、次のターゲットデータマイニングプロジェクト計画を決定します。

  3. (データの理解)感謝のデータ

    データの理解フェーズでは、データの収集を開始します。次のステップは、特定のような作業データ、に精通している:検出されたデータの量、データのデータ、プローブデータ興味深いサブセットの予備的な理解、ひいては情報の基礎となる仮定の形成。描画データを、データをロードし、生データを収集し、データの整合性と正確性、パディングと他の欠損値を含むデータ、単純な統計的特性、品質検査データの特性を探求します。

  4. データ準備(データ準備)

    データ準備フェーズは、(解析対象モデリングツールなど)すべての作業を最終的に設定された元のデータからの粗データの構造を覆います。データ準備作業を複数回行っても良いが、その実装は良い順番を処方されていません。このフェーズの主なタスクは、次のとおり行わモデリングツールを満たすためになど、時計、レコードの選択、およびデータ変数を変換するだけでなく、データクリーニングを、。

  5. モデリング(モデル化)

    ターゲット・マイニング、データの品質と技術的な制限、データをクリーンアップし、さらに変換するために使用される選択されたデータ解析として、誘導された可変設定、データ統合、および工具の必要条件、フォーマットされたデータに従ってとの相関。

    この段階では、モデリング方法の様々なパラメータが理想値に校正される構造、評価モデルによって選択して使用されます。より典型的には、データマイニング問題の同じタイプのため、種々の方法を使用するように選択することができるされています。複数の技術は、それぞれの技術のために、このタスクを使用することがある場合は別々に処理するために使用されます。いくつかのモデリング手法は、時には非常に必要な特定のタスクを実行するために戻ってデータの準備段階に、この段階では、そのため、データの形式に特定の要件があります。

  6. アセスメント(評価)

    考慮すべきデータ分析の観点から、この段階では、我々は1つ以上の高品質なモデルを確立しています。しかし、前に、最終的な導入モデル、より徹底した評価モデル、行っモデルを構築するプロセスの各ステップを確認し、それは非常に重要ですので、あなたは、モデルが対象会社に達していることを確認することができます。重要な評価はまだいくつかの重要なビジネス上の問題がされていない十分な注意と配慮があるかどうかを確認することです。この段階の終わりには、関連するデータ・マイニングの結果を使用することは、全会一致の決定に到達する必要があります。

  7. 展開(展開)

    展開は、すぐに自分の組織のプロセスを発見し、その結果が読み取り可能なテキストになります。究極の目標は、プロジェクトのモデルを作成することではありません。モデリングは、データに関するより多くの情報を追加することですが、情報はまだ顧客が整理して提示するために使用できるように、必要であるが。これは、多くの場合、このような「ライブ」モデルで、リアルタイムの担当者やマーケティングデータベース内のこれらのウェブページ上のスコアを繰り返す決定として、意思決定プロセスに対処する特定の組織になります。

    需要に応じて、展開段階では、レポートを書くのと同じくらい単純なことができ、それが企業内の反復可能なデータマイニングプログラムのように複雑になることがあります。多くの場合、顧客は多くの場合、導入フェーズを実行するには、データアナリストはありません。データアナリストは、作業の展開フェーズに対処する必要がありながら、しかし、顧客のために、活動の事前知識が正しく構築されたモデルは非常に重要である使用するために実行する必要があります。

おすすめ

転載: www.cnblogs.com/JasonBUPT/p/11610469.html