データマートとデータウェアハウスの違い

データ ウェアハウスは企業レベルであり、企業全体のさまざまな部門の運営に対する意思決定のサポートを提供できます。一方、データ マートは部門レベルであり、通常、特定のローカル エリアのマネージャーのみにサービスを提供できるため、データ マートとも呼ばれます。部門レベルのデータベース。

1. 2 つのデータ マート構造

データマートはデータの取得元に応じて以下の2種類に分けられます。

(1) 従属データマート
ここに画像の説明を挿入

いわゆる提携とは、そのデータが中央のデータ ウェアハウスから直接取得されることを意味します。この構造によりデータの一貫性が維持されます。

一般に、データ ウェアハウスに頻繁にアクセスする主要なビジネス部門に対して下位データ マートが確立され、クエリの応答速度が向上します。

(2) 独立したデータ マート 独立
ここに画像の説明を挿入
したデータ マートのデータ サブセットはさまざまな運用システムから取得されているため、多くの企業がデータ ウェアハウスの導入を計画する場合、それらは投資の検討対象外であることが多く、緊急の意思決定の問題となります。

2. データウェアハウスとデータマートの違い

(1) データウェアハウス:企業内のテーマに合わせた企業全体のデータモデルに基づいて構築されます。

データマート:特定の部門のデータモデルに基づいて構築されており、部門ごとに固有のニーズがあるため、データマートに対する期待も異なります。部門のトピックと企業のトピックの間には関連性がある場合とない場合があります。

(2) データ ウェアハウスには企業全体の非常に詳細なデータが保存されますが、データ マート データには詳細レベルが低く、より概要で包括的なデータが含まれています。

(3) データマートのデータ構成は、一般的にスターモデルを採用しています。大規模なデータ ウェアハウスのデータ構成は、スター型またはスノーフレーク型のいずれかになります。

(4) データ マートが履歴データを保持することはほとんどありません。

@二东东
RE: (3) データ マートのデータ構成は、一般にスター モデルを採用します。大規模なデータ ウェアハウスのデータ構成は、スター型またはスノーフレーク型のいずれかになります。

クラウド上のデータ ウェアハウスの時代 (2016 年に Redshift、BigQuery、Snowflake が登場した後)、データ マートのデータ組織は通常、ワイド テーブルを使用します。これは、BI またはアナリストがワイド テーブルを分析に直接使用できるためです (分析に慣れています)
。スター モデルを使用して結合するのではなく、2 次元テーブルを直接分析する方が良いです) クラウド上のデータ ウェアハウスの時代では、必要なのはデータ ストレージではなく労働力であるため、スター モデルのコスト上の利点は存在しません。最も高価であるため、時間と労力を節約し、直接分析できる ワイドテーブルはコストの面で有利ですが、スタースキーマの他の 2 つの利点については、パフォーマンスとわかりやすさはワイドテーブルほど良くありません
。この時代のデータマートのデータ構成はワイドテーブルであるべきです。

おすすめ

転載: blog.csdn.net/weixin_44976611/article/details/129215965