一、 偏业务型数仓设计
设计思路:
1/ 梳理业务流程
2/ 梳理数据流
3/ 数据类型、存储介质、样例数据
4/ 需求--功能性需求、非功能性需求(性能、时效性)
1/ 梳理业务流程和数据流
风控审核: 有很多策略、模型在里面。包括爬运营商的数据等。 搞清楚风控的数据存在哪儿,特征数据存在哪儿
用户注册:填写什么样的信息,填写进了什么样的表
认证项、申请受信同样。
有时流程中还包括子流程:
2/ 需要采集的表
3/ 采集方案:
rdbms
log
nginx
mongo
表的数据量、每日增量、updated_time\created_time,自增id,源表的索引情况.
4/ 抽象维度设计,最后形成这样的模型:
然后再设计各层的表。