データウェアハウスのコンセプト

1.データウェアハウス

長期データウェアハウスはまだ単一の定義、有名なデータ・ウェアハウスの専門家WH米国InMonではありません、彼の著書「Buildingtheデータウェアハウス」、以下の説明に与えられた本の中で:データウェアハウス(データウェアハウス)であるサブジェクト指向(指向件名)、統合されました(非-Volatile)比較的安定し、(統合)、データの(TimeVariant)コレクションの歴史的変化を反映した経営上の意思決定をサポートするために使用します。

データウェアハウスは、情報の中央リポジトリ典型的には、トランザクション・システム、リレーショナル・データベースおよび他の供給源から定期的にデータは、データウェアハウス内に流入します。ビジネスインテリジェンス(BI)ツール、SQLクライアントおよび他の分析ツールにより、ビジネスアナリスト、データ科学者と政策立案者は、アプリケーションやデータにアクセスできます。

私たちのために、データウェアハウスのコンセプトは二つのレベルから理解することができます。まず、データウェアハウスは、同社の既存の運用データベースと異なる分析データ処理のために、意思決定を支援するために、第二に、データウェアハウスは、統合がテーマに合わせて再編成された異種データソースのより効果的な統合され、データおよび履歴データを含み、データ・ウェアハウスに格納されているが、一般的に、もはや変更することはありません。

 

2、データマート

柔軟性、データ統合を最大化するために、データウェアハウスは、標準的なRDBMSに格納する必要があり、かつ標準化されたデータベース設計の後、だけでなく、パフォーマンスを向上させ、いくつかの要約情報と非標準的なデザインを追加します。このタイプの設計は、原子データウェアハウスのデータウェアハウスと呼ばれています。アトミックデータウェアハウス、データマートと呼ばれるサブセット

 

3、およびファクトテーブルのディメンション表

寸法表はの分析が含ま問題は記述のタイプを関係、ビジネス、組織や企業として、。カラムディメンションテーブルは、通常、情報のタイプのテキスト記述を含む、それが数値的記述情報であってもよい(例えば、製品重量、顧客の所得水準等)、ファクトテーブルはで分析対象の測定値を含んでいるが、関連する外部コードとディメンションテーブルを含んでいます。ディメンションテーブルとファクトテーブルは次元モデリングに含まテーブルであり、従来の三次元モデリングの概念の関係(主キー、外部キー、整合性制約、など)ことを除いて、モデルの寸法は、ディメンションテーブルとファクトテーブルの2種類が含まれていますテーブルの種類

 

5、メタデータ

メタデータ(メタデータ)は、データに関するデータである人々は抽象的な情報が生成されます、実世界の現象を説明し、これらの抽象的な情報をメタデータとして見ることができ、データは主に、コンテキスト情報データを記述するために使用されます。人気話す、データのライブラリ内の各書籍の内容ならば、その後、それぞれの本を見つけるためのインデックスは、メタデータである、他の方法がある優位性を一致させることができない理由は、メタデータの理由は、それがより多くの人々を助けることができるということですデータ、インとアウトのデータの発見と説明、DW / BIシステム企業の建設までのOLTPシステムから特によく理解、メタデータは、それらが明確かつ直感的なデータフロー図を形成することができ、メタデータは、基本のデータ管理と制御であります意味します。メタデータ技術、サービスのメタデータとメタデータを管理する:異なるオブジェクトに応じて説明したが、メタデータの3つのタイプに分けることができます。これら三つのメタデータの詳細な説明は次のとおりです。

特徴データ構造を含む技術分野のシステムデータにコンセプト、関係およびルールを、関連する技術データを記述する1)**技術メタデータメタデータは、データ処理は、データ・ソース・インターフェイスを覆う、データウェアハウス、データマートに記載されていますストレージ、ETL、OLAP、データのカプセル化及びプレゼンテーションフロントエンド、およびすべてのデータ処理段階;

2)**ビジネス・メタデータ・サービス・メタデータは、情報、分類情報を含むデータシステムの概念、関係やビジネスルール、ビジネス用語を説明すると、インジケータは、ビジネスルールを定義します。

3)**管理メタデータ管理メタデータは、人員の役割、仕事の責任と管理プロセスに関する情報を含むデータシステムの概念、関係と管理領域のルールを記述したデータです。

 

6、比較データウェアハウスとデータベース

データウェアハウスは、データ解析のために特別に設計され、それが理解するデータ間のデータ関係や傾向を大量に読んで含まれます。キャプチャし、このような記録されたトランザクションの詳細などのデータを格納するためのデータベース。

 

7、比較データウェアハウスとデータレイク

異なるデータ・ウェアハウス、中央リポジトリ内のデータ湖(構造化および非構造化データを含む)すべてのデータ。データウェアハウスは、分析のために事前定義されたスキーマを使用して最適化されます。データは湖のスキーマで定義されていない、このような大きなデータ分析、全文検索、リアルタイム分析と機械学習など他のタイプの分析をサポートします。

 

図8に示すように、データウェアハウスとデータマート比較

データマートは、(財務、マーケティングやセールスなど)、特定のチームやビジネスユニットの要件を満たすために、データウェアハウスです。それは小さく、より焦点を絞っており、最高の自分のユーザーコミュニティの概要をフィットするデータが含まれていてもよいです。

 

おすすめ

転載: www.cnblogs.com/SAPBI/p/11221778.html