数据仓库维度建模概述

大数据体系下数据仓库总体架构方案

数据仓库总体架构

数据仓库数据处理流程

数仓数据处理流程

数据仓库特点

  1. 面向主题的。操作型数据库的数据组织面向事物处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。例如:当事人、协议、机构、财务、事件、产品等主题。
  2. 集成的。数据仓库中的数据是从多个不同的数据源传送来的。多个应用之间在编码,命名习惯,物理属性(不同的数据库),字段的数据类型等方面存在不一致性。这些数据进入数据仓库,就进行转换,重新格式化,重新排列以及汇总等操作。从而消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
  3. 非易失的。数据仓库的数据通常是一批量方式载入和访问。但在数据仓库环境中并不进行更新(一般意义上的,很少有修改和删除操作)。数据仓库中的数据在进行装载时是以静态快照的格式进行的。当产生后继变化,一个新的快照记录会写入数据仓库。这样,在数据仓库中就保存了数据的历史情况。
  4. 随时间变化的。数据仓库中的每个数据单元只是在某个时间是准确的。数据仓库的表结构总是包含时间元素,加个时间戳来表示是哪一天的数据。

ODS、数据集市、数据仓库、数据挖掘的异同点

  • 基本概念
  • ODS :操作型数据仓库
  • 数据仓库:简称EDW,企业级数据仓库
  • 数据集市:Data Mart 简称DM,以某个应用为出发点而建设的局部DW,DM只关心自己需要的数据。不会全盘考虑企业整体的数据架构和应用,每个应用都有自己的DM。所以DM可以基于仓库建设也可以独立建设。
  • 数据挖掘:简称Data mining。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

模型设计思路对比

对比


猜你喜欢

转载自blog.csdn.net/bs1366/article/details/80014571