データウェアハウスのETLのケーススタディ(A)

コースからケーススタディ  

多国籍食品スーパーマーケット情報管理システムは、一日数千人の周りのスーパーマーケットチェーンの売り上げを記録します。ビッグデータの背景に基づいて、同社の経営陣はのFoodMartはさらに、ヘルプ経営の意思決定に、商業的価値の大規模データマイニング情報から期待されるデータウェアハウスを構築することを決めました。

販売データウェアハウスを設計します。要件:

1、少なくとも四つの寸法、少なくとも3つの特性の各寸法、可能含む二次元層。

2、少なくとも一つのファクトテーブル。

図3に示すように、データソース(メトリックフィールド寸法と設計データのソースに直接または間接的であるべきである)を得ることができます。

 

*以下の使用SQL Serverの統合サービス(SSIS) 

 

次のように設計されたデータウェアハウスの概念モデルの(A)デザイン:

 

*スノーフレークことができるアイデアの独自のデザインコンセプトモデルによると、スターになることができます

 

 

(B)ソース・データ・ウェアハウス、データビュー、ローディングディメンションテーブル

1. プロジェクトの設立

 

 

 

 

前記データセットは、SQLサーバーを導入した(本明細書データベースSQL Serverへの最初のアクセスを、SSISは、ドライブがアクセスレーンSSISに直接使用することができる、再利用しました)

 

 

 

 

 

 

  

3. SQLサーバーとの接続を確立

 

4. 順次ロードデータ製品寸法、顧客寸法、日付、大きさ、寸法チェーン店、プロモーションディメンション。

2次元の表の製品に関わる製品、product_class、必要なデータを取得するクエリを生成するに従って、

 

デスティネーション・エディタは、データウェアハウスに新しいテーブルを選択します。

 

同様次元積載品

同様にプロモーションの寸法をロード

 

ロードされた顧客ディメンション

同様に、ロード時間ディメンション

それは、派生列と日付関数、すなわち年の設立、月、日を使用して、時刻文字列分割する必要があります(PSは:手動で時間ディメンションを作成する必要はありません、データウェアハウスは、時間ディメンションを確立するためのテンプレートを提供し、後に挙げることでしょう)

5. ロードファクトテーブル

这里需要对汇率进行转换,将saledetail表和currency分别处理(查找、派生、排序等)后通过合并转换的内连接,使得汇率与交易的地区相对应,再加派生列,计算所得的利润。具体的细节如下:

1)   需要将currency的地区和日期与saledetail地区与日期做处理,才能够相对应

2)两边的数据进行内连接

 

3)通过派生列计算利润

 

4)装载数据成功,共计251395行

 

 

6.结果如下:

 

在SQL数据库里可以查看装载好的数据仓库

7.在Sql数据库中设置每周六晚24时自动执行装载新业务数据

要把所有者改为[sa],才可以运行成功

 

 欢迎小伙伴的批评指正~

 

おすすめ

転載: www.cnblogs.com/EVA-YANG/p/11874447.html