数仓建模简介

维度建模法

维度建模法: 就是按照事实表和维度表来构建数仓

一般在数仓DWD层进行建模.

有星型模型,雪花模型,星座模型.

星形模型:事实表可以关联多个维度表,维度表之间没有关系
雪花模型:事实表关联维度表,然后维度再关联维度表,维度表间有关系
星座模型:多个事实表关联相同的维度表

典型代表:星型模型

好处:

星型模型的设计方式主要带来的好处是能够提升查询效率,因为生成的事实表已经经过预处理,主要的数据都在事实表里面,所以只要扫描事实表就能够进行大量的查询,而不必进行大量的join,其次维表数据一般比较少,在join可直接放入内存进行join以提升效率,除此之外,星型模型的事实表可读性比较好,不用关联多个表就能获取大部分核心信息设计维护相对比较简单。通过大量的冗余来减少表查询的次数从而提升查询效率,星型模型对OLAP的分析引擎支持比较友好,这一点在Kylin中比较能体现。

维度建模步骤:

1.选择需要进行分析决策的业务过程.

业务过程可以是单个业务事件,比如交易的支付、退款等;也可以是某个事件的状态,比如当前的账户余额等;还可以是一系列相关业务事件组成的业务流程,具体需要看我们分析的是某些事件发生情况,还是当前状态,或是事件流转效率。

2.选择粒度

在事件分析中,我们需要预判所有分析需求细分的程度,从而决定选择的粒度,粒度是维度的一个组合。

3.确定维度

选择好粒度之后,就需要基于粒度设计维表,包括维度属性,用于分析时进行分组和筛选。

4.确定事实

确定分析需要衡量的指标。

猜你喜欢

转载自blog.csdn.net/weixin_47699191/article/details/115012522