大数据之路、阿里巴巴大数据实践读书笔记 --- 第十一章、事实表设计

本章节与上一章节第十章一样,都是本书最难理解的部分,建议如果有不理解的部分,可以先标记,后面实战后再消化。

一、事实表基础

  • 事实表特性

    • 事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计,通过获取描述业务过程的度量来表达业务过程,包含了引用的维度和于业务过程有关的度量;

    • 事实表中一条记录所表达的业务细节程度被称为粒度。通常粒度可以通过两种方式来表达:

      • 一种是维度属性组合所表示的细节程度;

      • 一种是所表示的具体业务含义;

    • 作为度量业务过程的事实,一般为整形或浮点型的十进制数值三种类型:

      • 有加性(是指可以按照与事实表关联的任意维度进行汇总)

      • 半可加性(是指事实只能按照特定维度汇总,不能对所有维度汇总,比如库存可以按照地点和商品进行汇总,而按时间维度把一年中每个月的库存累加起来则毫无意义)

      • 不可加性(比如比率型事实。对于不可加性事实可以分解为可加的组件来实现聚集);

    • 相对于维表来说,通常事实表要细长的多,行的增加速度也比维表快很多;

    • 维度属性也可以存储到事实表中,这种存储到事实表的维度列被称为“退化维度”。与其他存储在维表中的维度一样,退化维度也可以用来进行事实表的过滤查询、实现聚合操作等;

    • 事实表的三种类型:

      • 事务事实表;

        • 用来描述业务过程,跟踪空间或时间上某点的度量事件,保存的是最原子的数据,也称为“原

猜你喜欢

转载自blog.csdn.net/u012965373/article/details/105377950