数仓设计实战案例

一、 偏业务型数仓设计

 设计思路:

1/ 梳理业务流程
2/ 梳理数据流
3/ 数据类型、存储介质、样例数据
4/ 需求--功能性需求、非功能性需求(性能、时效性)

1/ 梳理业务流程和数据流

风控审核: 有很多策略、模型在里面。包括爬运营商的数据等。 搞清楚风控的数据存在哪儿,特征数据存在哪儿

用户注册:填写什么样的信息,填写进了什么样的表

认证项、申请受信同样。

有时流程中还包括子流程:

2/ 需要采集的表

3/ 采集方案:
rdbms
log
nginx
mongo

表的数据量、每日增量、updated_time\created_time,自增id,源表的索引情况.

4/ 抽象维度设计,最后形成这样的模型:

然后再设计各层的表。 

猜你喜欢

转载自www.cnblogs.com/hongfeng2019/p/12297118.html
今日推荐