数仓建模的四种方法 - 代码天地

数仓建模的四种方法

其他 2020-04-22 10:43:57 阅读次数: 0

一.数据仓库建模的目的

为什么要进行数据仓库建模？大数据的数仓建模是通过建模的方法更好的组织、存储数据，以便在性能、成本、效率和数据质量之间找到最佳平衡点。一般主要从下面四点考虑

访问性能：能够快速查询所需的数据，减少数据I/O
数据成本：减少不必要的数据冗余，实现计算结果数据复用，降低大数据系统中的存储成本和计算成本
使用效率：改善用户应用体验，提高使用数据的效率
数据质量：改善数据统计口径的不一致性，减少数据计算错误的可能性，提供高质量的、一致的数据访问平台

二.常见的数据建模方法

数据仓库本质是从数据库衍生出来的，所以数据仓库的建模也是不断衍生发展的。从最早的借鉴数据库的范式建模，到逐渐提出维度建模，Data Vault模型，Anchor模型等等，越往后建模的要求越高，越需满足3NF,4NF等。但是对于数据仓库来说，目前主流还是维度建模,会夹杂着范式建模。

数据仓库建模方法论可分为：范式建模、维度建模、Data Vault模型、Anchor模型。
在这里插入图片描述
其中前三种模型分别对应了三本书：《数据仓库》、《数据仓库工具箱》和《数据架构大数据数据仓库以及Data Vault》，这三本书都有中文版，正好对应了这三种理论。Anchor模型我并不是特别熟悉，放在这里以供参考。

三.四种方法的建模步骤与演示

1.范式建模（E-R模型）

猜你喜欢

转载自blog.csdn.net/ZZQHELLO2018/article/details/105574186

数仓建模的四种方法

“回文数”用python实现的四种方法

求平均数的四种方法

matlab/simulink::（七）simulink控制系统建模的四种方法

Map遍历的四种方法

遍历Map的四种方法

庄家派发的四种方法

spring getBean四种方法

使用反射的四种方法

最短路的四种方法

创建线程的四种方法

ArrayList输出的四种方法

判断素数的四种方法

Java线程的四种方法

Java四种方法引用

浮动的清除 -- 四种方法

随机排序四种方法

xml 解析的四种方法

垂直居中四种方法

Map遍历四种方法

session 共享的四种方法

遍历HashMap的四种方法

Map 遍历的四种方法

HIVE优化的四种方法

传参的四种方法

轮播图的四种方法

JS继承四种方法

反转链表-四种方法

打印素数的四种方法

清除浮动的四种方法

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)