Introducción al modelado de almacenamiento de datos

Modelado dimensional

Método de modelado dimensional : construya un almacén de datos de acuerdo con la tabla de hechos y la tabla de dimensiones

El modelado generalmente se realiza en la capa DWD del almacén de datos.

Hay modelos de estrellas, modelos de copos de nieve y modelos de constelaciones.

星形模型:事实表可以关联多个维度表,维度表之间没有关系
雪花模型:事实表关联维度表,然后维度再关联维度表,维度表间有关系
星座模型:多个事实表关联相同的维度表

Representante típico: modelo estrella

beneficio:

星型模型的设计方式主要带来的好处是能够提升查询效率,因为生成的事实表已经经过预处理,主要的数据都在事实表里面,所以只要扫描事实表就能够进行大量的查询,而不必进行大量的join,其次维表数据一般比较少,在join可直接放入内存进行join以提升效率,除此之外,星型模型的事实表可读性比较好,不用关联多个表就能获取大部分核心信息设计维护相对比较简单。通过大量的冗余来减少表查询的次数从而提升查询效率,星型模型对OLAP的分析引擎支持比较友好,这一点在Kylin中比较能体现。

Pasos del modelado dimensional:

1. Seleccione el análisis requerido para el proceso de toma de decisiones comerciales.

El proceso comercial puede ser un solo evento comercial, como el pago de la transacción, el reembolso, etc .; también puede ser el estado de un evento, como el saldo de la cuenta corriente, etc .; también puede ser un proceso comercial compuesto por un serie de eventos comerciales relacionados, dependiendo de nosotros Lo que se analiza es la ocurrencia de ciertos eventos, el estado actual o la eficiencia de la circulación de eventos.

2. Elija la granularidad

En el análisis de eventos, necesitamos predecir el grado de subdivisión de todos los requisitos de análisis para determinar la granularidad de elección, que es una combinación de dimensiones.

3. Determine las dimensiones

Después de seleccionar la granularidad, debe diseñar la tabla de dimensiones en función de la granularidad, incluidos los atributos de dimensión, para agrupar y filtrar durante el análisis.

4. Determine los hechos

Determine los indicadores que deben medirse para el análisis.

Supongo que te gusta

Origin blog.csdn.net/weixin_47699191/article/details/115012522
Recomendado
Clasificación