データ ウェアハウスのシンプルかつ明確な紹介

その名の通り、データを保管するウェアハウスのことで、さまざまな業務システムからデータを収集しており、金融業界を例にとると、融資業務、CRM、預金業務などのデータが格納されています。企業ではデータ分析、レポート作成、意思決定に使用されており、一部の企業ではさまざまなビジネス システムのデータ ソースとしても使用されています。

論理的に言えば、データベースとデータ ウェアハウスに違いはなく、どちらもデータベース ソフトウェアを介してデータが保存される場所ですが、データ量の点ではデータ ウェアハウスの方がデータベースよりも大きくなります。

これらの主な違いは、MySQL などの従来のトランザクション データベースはトランザクション イベントの発生などのオンライン トランザクション処理 (OLTP) に使用されるのに対し、データ ウェアハウスは主にレポートの作成などのオンライン分析処理 (OLAP) に使用されることです。

データ分析、レポート生成、その他のタスクもビジネス データベースを通じて直接完了でき、データ ウェアハウスは必須ではないようだと考える学生もいるかもしれません。

立ち上げ期の数台のサーバーと複数の MySQL で構成されるシステムなど、業務量、ユーザー数、データ数が少ない単純なシステムであれば、確かに実現可能です。しかし、ビジネスがますます成長し、ユーザーとデータの量が膨大になり、クラスター間で複数のシステムからのデータを関連付けることによってレポートを作成する必要がある場合、やはりデータ ウェアハウスが必要になります。

それでも理解できない場合は、まずいくつかの質問について考えてください

必要なデータがさまざまなデータベースに保存されている場合や、さまざまなログ ファイルに存在する場合、どうやってデータを取得すればよいでしょうか?

さまざまなデータソースから欲しいデータを取り出したものの、形式が違ったり、データ型が違ったりした場合、どうやって標準化するのでしょうか?

ある日、ビジネス システムの履歴データを確認する必要が生じたときに、データが変更されていることが判明した場合、どうしますか?

クラスター間で異なるビジネス システムからのデータを関連付けたい場合はどうすればよいでしょうか? クエリ時間を最適化するにはどうすればよいですか?

データ ウェアハウスの出現により、上記の問題は十分に解決できます。データの抽出やクリーニングを通じて、さまざまなビジネス システムのデータを 1 つのシステム (データ ウェアハウス) に統合し、データを標準化し、レポート作成や意思決定時のデータ取得を容易にします。

データウェアハウスの特徴

統合

データ ウェアハウスに保存されるデータは複数のデータ ソースから取得され、元のデータはさまざまな方法でさまざまなデータ ソースに保存されます。最終的なデータ収集に統合するには、データ ソースからの一連の抽出、クリーニング、変換プロセスが必要です。

安定性

データ ウェアハウスに保存されたデータは履歴記録であり、変更することはできません。ユーザーは、分析ツールを通じてのみクエリと分析を行うことができます。

動的

データ ウェアハウス内のデータは、時間の変化に応じて定期的に更新されます。ここでの定期的な更新とは、データを変更することを指します。一般に、業務システム内で変更されたデータは、定期的にデータ ウェアハウスに同期され、安定性とは矛盾しません。非更新可能はアプリケーション向けです。つまり、ユーザーの分析および処理中にデータは更新されません。

テーマ別

従来のデータベースはさまざまなビジネスに対応しており、データ ウェアハウスはニーズに応じてさまざまなデータ ソースからのデータを統合する必要があります。つまり、データは通常、特定のビジネス テーマに基づいてモデル化されています。たとえば、「ローン」トピック、「預金」トピックなどです。

データウェアハウスの階層化

一般にデータウェアハウスは階層構造となっており、企業ごとにビジネスシナリオに基づいて階層構造となっており、現状の階層構造は多様であると言え、標準的な答えは存在しません。しかし、最も主流の方法は、次のようにレイヤー化することです。

データウェアハウスの階層化の意味

繰り返しの開発を減らすために、データ開発プロセス中に中間層を生成して共通ロジックをシンクし、繰り返しの計算を減らすことができます。

明確なデータ構造、各レイヤーの明確な分業、開発者にとって理解しやすい。

問題を特定したり、階層化によってデータの血縁関係を理解し​​たり、問題が発生したときにバックトラッキングによって問題を特定したりするのに便利です。

複雑な問題を単純化することは、分割統治の考え方に似ており、分割統治は複雑な問題を単純化します。

免責事項:この公開アカウントが公開する記事は、この公開アカウントのオリジナル、またはインターネット上で検索された優れた記事を編集・編集したものであり、記事の著作権は原著者に帰属し、読者や友人が学び参照することのみを目的としています。に。共有されている非オリジナルの記事については、実際の情報源が見つからない場合があります。情報源が間違ってマークされている場合、または記事内で使用されている写真、リンクなどには、ソフトウェア、資料などが含まれますが、これらに限定されません。侵害がある場合は、バックグラウンドに直接連絡して詳細を説明してください。記事はバックグラウンドでできるだけ早く削除されます。ご不便をおかけして申し訳ございません。

おすすめ

転載: blog.csdn.net/weixin_44958787/article/details/132601881