データウェアハウスの知識櫛(1)

近年では、「ビッグデータ」と、「データ駆動型」、「データセット」など積極的にインターネットコミュニティに参加したコンセプト、モデル予測と他の職員に推薦アルゴリズムを処理し、データ収集を理解しても良好となっています。ビッグデータの時代でこれらのスキル領域は、来たという認識。実際には、初期の90のデータウェアハウスやデータ意思決定支援システムのコンセプトへの最後の世紀の早ければ80年には、複数のソースから一緒に、本質的には、支援企業にデータ解析のための統計的方法の使用をすべてのデータを提案されています様々な意思決定。

今、新しい名前は、私たちは知識によって、データ・ウェアハウス・プロジェクトにおけるビッグデータの実践を導くことができます。このホワイトペーパーの歴史や背景、データウェアハウスは、「知識のデータ・ウェアハウス・ソート、」このシリーズの最初の記事として紹介されます。

データストレージの01の開発

狭義では、データウェアハウスは、データ記憶装置の形態です。コンピュータの出現以来、デジタルデータストレージは、以下の段階を経験してきました。

  • 1950
    パンチカード(パンチカード)、第1のデータ記憶媒体
  • 1960
    磁気記憶装置(テープ、ディスク)
  • 1970年代
    最初のデータベース管理ソフトウェア(IMS)、階層型データベース
    DBTG、ネットワークデータベース
  • 1980年代初頭
    、リレーショナルデータモデル、RDBMSの実装
  • 1980年代後半-1990s
    データマイニング、データウェアハウス(WH米国InMon)
    人気の95年間のデータウェアハウス:IBMのDWプログラムは、Oracle / SQL ServerのOLAP Servicesのバインディング
  • 2000年代
    のオンラインデータの成長には、BIソリューションの一部となる
    ビッグデータ、NoSQLのシステムと連動して

02エンタープライズレベルの意思決定

エンタープライズデータウェアハウスの展開は、その目的は現在の状況を説明するために、次の行動計画のサポートを提供するためにデータを使用することです。以下に示すように、企業の意思決定には、3つのレベルに分けることができます。

ステータスが異常な作品を失われる可能性があり、あなたが処理するための物流に連絡する必要があり、「発行」などの長期電力供給物流の受注として、オペレータが実行できるあり、基礎となることができます。真ん中を予測売上高は、いくつかの時間のために販売予測に基づく売上の履歴を記録する必要性は、このレベルは、特定のセクター内で使用することができます。新しいトップレベルの認識やお店の場所や他の市場行動は、私たちは一緒に、このような、地理的人口統計学的および経済データの組み合わせとして、全社のデータ、さらには外部データを、考慮して意思決定をする必要があります。

テーブル内のデータウェアハウスやデータを構築するときにそのため、より複雑なシステムは、より良い、キーが必要のようなものが、意思決定のレベルをサポートする方法を確認することですと言うことではありません。そうであっても上の要因の難しさと建設期間との様々な態様の実施を考慮することによって続きます。

リミット03データベース技術

「異常な注文処理」のセクションに、薄手のタイムアウト警告が与えられると、リレーショナル・データベース内で直接実施することができます。しかし、トップの意思決定、開発は、リレーショナルデータベースで次の3つの質問が発生することがあります。

1.パフォーマンスの制限:
1.取引や統計調査のBIの意思決定のタイプを保証することはできません。

2.統合の度合いが十分ではない:
1.C / S、B / Sアーキテクチャ、データベースに依存しないサービス固有アプリケーション、データが分散されている
データ2の外部データソースと同様に
、様々なシステム間の名前3、統一口径部

3.方法論ツールの欠如
1.最適化クエリ統計に
方法論2.データモデリング
、統計クエリと統計解析ツールをサポート3.

これらの理由から、データウェアハウスおよびビジネスは異なる基礎となるデータベースの設計を持っています。

定義された06データウェアハウス

データウェアハウスは、経営の意思決定データ収集をサポートするために、不揮発性、時間的に変化する人員サブジェクト指向、統合されています。

- 「データウェアハウス(第4版)」

  • サブジェクト指向、それはマクロ経済分析の分野に関与する特定の企業に対応するオブジェクトの分析を指します

    • 例:「販売分析は、」分析の分野であります

    • この解析対象「販売分析」関与の商品、サプライヤー、顧客、倉庫など、その位置のテーマの数は、商品のテーマとして識別することができ、テーマサプライヤー、顧客のテーマ、倉庫のテーマ

    • データレベルは、データのテーマ間の関係の重複があるかもしれません

  • 統合されました

    • 異種データソースの複数のデータ
    • 標準化されたデータの統合
  • 不揮発性

    • データストレージおよびデータ・ソース分離
    • データをデータウェアハウスに書き込まれると更新されません
    • 初期のデータウェアハウスは、データのロードおよびアクセスをサポートしています
  • 経時変化

    • 履歴データを保管してください(スナップショットデータ)

    • 時間の要素を含むデータウェアハウス(記録タイムスタンプ)

    • 達成するために、異なる時刻にデータを変化させることにより、データ加算モード

05データモデリング

今では、データウェアハウスの最も基本的な機能は、データストレージは、次の問題がどのように、データを格納することです。比較的通常の方法をモデル化に関わる業務データベースを話す、次元モデリングのための現在の主流のように設計されたデータモデリングデータストレージ。

左、上の図では、SQLクエリを減らす、テーブルのデータとビジネスエンティティ、運用システムと新しいお問い合わせのサービスデータベースモデル、受注、顧客、製品などです。一般的には「パターン」のモデリング要件に沿っインチ

右側には、ディメンション表は、その他の情報をドッキング、ファクトテーブルで、売却対象に倉庫スター・スキーマの数です。これは、多数の属性がディメンション表に保存されている、小さなデータ冗長性を備え、明確な構造、関連するデータ分析のためのツールを使用して簡単にできます。ツールの下MDXと簡単な文法についての記事の背後に一人だろう、業界標準のデータウェアハウスのクエリ言語が実際にSQLが、MDXないが、ここでは言及したいと思います。

06アーキテクチャ

データウェアハウスのアーキテクチャ設計のトップダウンとボトムのビルドは、最大2つの方法で構築します。

企業からの需要全体を構築するための必要性は、全体的なデータモデルを設計し始め、統一された方法で対応するモデルオブジェクトの中に一緒にすべての必要なデータのETLをもたらすするトップダウン・アプローチ。最後に、セクタを以下の企業に提供されるアクセスデータへのアクセス許可の特定のセットを通ります。

ボトムアップアプローチは、小規模のサブセクタデータモデルでもデータマートとしても知られているデータウェアハウス内のセクタ固有のサービスの確立を特定のトピックを得ることができます。

自分のアーキテクチャを選択する方法としては、それは、以下の2つの側面から考えることができます。

  • ROI

    • プロジェクトのリスク:トップダウンアプローチは長い期間がかかることがあり、異なる部門間の転送データは、志周になるためにバインドされています
    • ビジネスバリュー:データが含まれているより焦点を絞った関係を見つける可能性が高いです
  • ITセクション角度

    • 政策を資金源:明確なプロジェクトのスポンサーとの受益者
    • データの出典:明確なデータを提供することができます。

07要約

この記事簡潔には、データが生成されたウェアハウジング、データウェアハウスのアーキテクチャ設計、データモデリングとデジタル倉庫の定義を履歴データストレージの理由を説明しています。

社会的関心のスキャン二次元コード番号へようこそ

おすすめ

転載: www.cnblogs.com/shenfeng/p/datawarehouse_intro_1.html