学习数据仓库之概念基础

数据仓库与数据库的差别是什么呢?各自的应用场景在哪里呢?

在业务系统中使用的数据库,其中一般存储的是在线交易数据,是以业务单位组织数据并进行存储的。由于数据库是面向具体的应用,现在一般采用关系模型的设计方法。通过关系模型以保证数据的原子性、一致性和完整性,消除数据冗余,一般采用符合范式的规则来约束设计。

数据仓库从设计之初就是为了数据分析服务的,因此在数据组织上是以面向主题进行组织和存储的。是通过在多个维度上对历史数据进行观察和分析,为决策人员提供在该关注点(主题)上的辅助决策信息。因此在设计上也不同于数据库的关系模型,而是采用多维分析数据模型。

数据仓库是分析系统的数据平台,它利用从事务系统获取数据,并做汇总、加工,为决策者提供决策的依据。

分析系统是事后的,它要提供关注时间段内所有的有效数据。这些数据是海量的,汇总计算起来也要慢一些,但是,只要能够提供有效的分析数据就达到目的了。

 数据仓库有事实表和维度表。

事实表中一般存放的是和主题相关的度量(数值)数据以及为了和维表连接而建立的键字段,在维度表中存放的多是维度描述信息和键字段。

为了更好地理解,我们可以看看这个例子:

对于有个商品的营销业务进行分析,下面列出了我们的分析的需求目标、分析的维度指标、维度的层次结构等,可以更好的理解什么是事实表,什么是维度表。

 我们的事实表存放的是商品的销售记录。维度表存放的是客户的信息、商品的信息等。

猜你喜欢

转载自www.cnblogs.com/EVA-YANG/p/11850404.html