[ビン数]データウェアハウス設計

データウェアハウスの設計

I.概要

 特徴データウェアハウスは、サブジェクト指向、統合された、時間的に変化する安定性と経営の意思決定をサポートするためです。データウェアハウスの存在意義は、すべての企業データは、企業の様々な部門のために均一に提供するデータのエクスポートを標準化するために凝集していることです。データ・ウェアハウスは、多くの場合、ビルドプロセス中にスライスが必要です。さまざまなビジネス、階層化技術の処理手段も異なっています。主な理由の階層的位置の数:

  • 明確なデータ構造
     の各階層データのためには、より容易に理解することができ、テーブルの使用に配置され、その範囲を有しています。
  • データ追跡する系統
     のビジネスへの最終プレゼンテーションは、ビジネステーブルであるため、直接使用することができますが、ソーステーブルに問題がある場合は、データテーブルの多くの原因は、そこにあり、我々は、迅速かつ正確に問題を見つけることができると思っていて、明らかに彼の害範囲。
  • 開発の重複削減
     仕様階層データを、いくつかの共通データの中間層、ダブルカウントの開発を大幅に低減することができます。
  • 複雑な問題を単純化し
     、シンプルで理解しやすい完了するために複数のステップに複雑な作業、それぞれの層のみの単一段階のプロセスを、。そして、データの正確性を維持しやすく、ときにデータの問題、あなたはすべてのデータを修正することはできません、単に問題の開始修理から繰り返します。

    II。データウェアハウス階層設計

     ODSオペレーショナルデータ記憶層に共通のデータ・ウェアハウス、DWとDWS DWD層の層に分割されている層DWデータウェアハウス層とデータマートDM三層、。データウェアハウスの階層構造を以下に示します:

2.1 ODS層

 1つのビジネス・データベースへの1つに、ビジネスデータベース、テーブル、テーブルODS層のすべての層からのODSのデータは、ビジネス・データベースは、データウェアハウスの再確立に基礎となる表構造と完全に一致するデータです。
 本質的にERモデリングエンティティとしてサービスデータベース(OLTP)ので、モデリングER ODS層はソリッドモデルです。

2.2 DW層

 行うにDWD層は、非標準のデータが処理される命名、データ、統合、標準化、汚れ、ゴミデータ、仕様が矛盾している、一貫性のない状態の定義をクリーンアップすることです。DWD層は、すべてのシステム、完全な、きれいな、一貫性のあるデータ層をカバーする必要があります。DWD層に基づく三次元モデル、デザインファクトとディメンションテーブルでは、そのDWD層は非常に標準化された、高品質、ディテールの信頼性の高いデータがあります。
 DWS層は共通層の要約である、要約は、基本データDWD層、特定の対象領域を分析するために、集約、統合サービス・データに基づいて詳細の粒径よりも厚い、マイルドとなり、一般的に広いテーブルです。DWS層は、シナリオの80%をカバーする必要があります。

III。次元モデル

 次元モデリングの理論はラルフ・キンボールによって提案された、彼はテーブルが2種類のデータ・ウェアハウスのファクトとディメンションテーブルに分かれて提案しました。次元モデリングデータマートから、主にシーン解析のために。大規模なパフォーマンス・データへの迅速な応答を提供しながら、高速で、柔軟なソリューションの分析ニーズに焦点を当て、次元モデリングは、モデルは、いくつかのシーン解析のためのポジションを構築し、シーン指向分析を生まれています。標的、主に基礎となるデータ・モデルを構築するために、データウェアハウスとOLAPエンジンに使用されます。
 事実、その尺度(その測定)と、各キーポイントの外側の寸法を格納するために使用される「真理値表」。その上で平和維持レベルと会員のカテゴリを含むディメンションのメタデータ、記述情報の大きさを、保存するために「寸法表」。
 簡単に言えば、ディメンション表には、あなたが物事(寸法)を見る角度、あなたが注目したい目次事実です。例えば、ユーザは、タクシーをドロップし、その後、この問題は、タクシー順序ファクトテーブルという事実テーブルに変換することができるタクシーは、ユーザは運転者のディメンションテーブルに対応する、ユーザディメンションテーブルに対応します。

ファクト表3.1

 現実の世界では、すべての操作イベントは、基本的な操作のイベントの発生に伴い、エンティティ間で発生し、測定可能な値を生成し、このプロセスは、ファクトテーブルに格納し、各を生じさせました測定可能なイベント。
 メトリック値は、ファクトテーブルに格納されて生成された現実世界の操作イベント、中に発生する可能性があります。ビューの粒状の最低レベルから、ファクトテーブルの行は、イベントの尺度、およびその逆に対応します。そのため、物理的な活動に完全に依存してファクトテーブルのデザインは、インパクトが最終的な報告書を作成する可能性はありません。デジタル測定に加えて、常にファクトテーブルは、キーの寸法および日付/タイムスタンプの劣化任意に、関連次元それに関連するため、外部キーを含んでいます。クエリ要求の主な目的は、ファクト表計算と集計操作に基づいています。
 ファクトテーブルは、通常、三つの重要な要素が含まれています。

  • 寸法表の外部キー
  • メトリック
  • イベント説明情報

 そのような顧客を含む体を含む購入電力供給のシーン、製品などのイベントでは、企業は、メトリックは、アイテムの数、量、数、その他の部分を含んで生成することができます。

3.2ディメンション表

 各ディメンション表は、単一の主キー列が含まれています。外部キーとして主キーディメンションテーブルは、ファクトテーブルの行に正確に対応しなければならないコンテキストディメンションテーブルの行に記載され、当然のことながら、任意のファクトテーブルに関連付けられてもよいです。ディメンションテーブル通常広い、フラット型の非指定のテーブル、テキスト属性は、低粒子サイズを多く含みます。
 このような商品、単一の主キーアイテムID、起源、色、素材、サイズ、単価などのプロパティではなく、属性は、このような価格、サイズなど、テキストである必要があり、毎日の主要寸法は、数値の記述抽象備えるには、次のとおりです。時間ディメンション表、ディメンション表およびその他の地域。

次のように要約すると、ユーザ(単一商品)の動作のための単一次元モデリングと、モデルを得ることができます。

IV。データウェアハウスの仕様

4.1仕様表の名前

 すべての利害関係者のためのデータ・テーブル情報を作成するには、共通の理解を含んでいました。例えば、その層(ODS、DWの詳細、DW要約、DM)の一部?どの事業/部署?どの寸法(ユーザー、車載コンピュータ機器)?何時間スパン(日、月、年、リアルタイム)?増分または全額?
命名形式:_ビジネスレベル/部門_修正/説明_レンジ/サイクル

次の表で指定されたデータ・ウェアハウスの仕様表:

ナンバー倉庫レベル サイクル/データ範囲
公共寸法 薄暗いです デイスナップショット D
DM層 DM インクリメンタル
ODS層 ODS ワット
DWD層 DWD ジッパーテーブル リットル
DWS層 dws 非分区全量表 a

おすすめ

転載: www.cnblogs.com/skyell/p/11005666.html