数据建模之总线矩阵

定义:

总线矩阵提供一种分解企业DW/BI规划任务的合理方式,行是业务过程,列是公共维度(一致性维度),图表中的X表示的是哪些列与哪些行有关系,也表示这一个业务过程需要有哪些公共维度。

先看一个总线矩阵的示例图(出自kimball的书):

必要性

企业数据仓库总线矩阵是DW/BI系统的一个总体数据架构,如果我们在建立数据仓库的时候,只考虑单独的某个业务系统的数据建设,则无法满足一致性的目标,例如:相互有联系的系统数据的维度不同导致关联复杂或者关联不上,数据之间互相成为了孤岛,对于后期的扩展或者整个数仓的建设都是巨大的阻碍。

举例

那么总线矩阵就给我们提供了这么一个工具,每一行是一个业务过程,每一列是这个业务过程可能涉及到的一些维度,比如说上图中的零售业务过程,这块涉及到的公用维度包括:日期维度,产品维度,商店维度,促销维度,客户维度,雇员(销售员)维度。

再看仓库库存业务过程,包含了日期维度,产品维度,仓库维度。

通过日期维度或者产品维度或者仓库维度,我们可以将每天的某种商品的库存数据和销售数据关联起来进行分析,这就是一致性维度的好处,假设这两部分数据没有经过提前规划,各部分数据都有不同的维表,那这两部分数据想要联系起来太难了。

益处

通过总线矩阵,我们对整个数仓的结构能够有一个清晰的了解,很容易就能看出来某个业务过程包含哪些通用维度。通过总线菊展建设数据结构框架,可以处理不同的以过程为中心的维度模型的实现,且他们的实现严格遵守一致性维度。各部分维度模型可以互相配合,互相联系。

猜你喜欢

转载自blog.csdn.net/a6822342/article/details/107620099