数据仓库(三)高效运营支撑平台数仓项目之一

版权声明:@GaoShan https://blog.csdn.net/weixin_42969976/article/details/86520078

高效运营支撑平台数仓项目之业务阐述

本平台是外卖行业类得自营业务得运行分析平台得一部分,通过对业务数据的分析,获得用户主题和订单得相关分析情况,生成用户的访问模型和用户的订单行为模型,对访问时段和下单区域分布进行分析和报表展示。

前期准备以及调查

业务表数据模型
移动客户端用户点击日志表:user_app_click_log
pc端用户点击日志表:user_pc_click_log
用户信息表:user
用户信息扩展表:user_extend
订单购物车表:order_cart
订单项表:order_item (注意:一个订单中可能包含有多个订单项)
订单收货表:order_delivery
用户订单表:user_order
交易信息表:biz_trade
用户地址表:user_addr
码表(外卖平台后台的管理员通过后台的管理系统手动录入的/通过自动筛选出注册用户的下单的信息,然后再插入到表中的)
类目码表:code_category <~ 用来描述商品(外卖)的类目
用户职业码表:code_profession <~ 用来描述客户的职业
城市码表:code_city <~ 用来描述客户的所属的城市
加盟店码表:code_shop <~ 用来描述加盟店的信息描述
加盟店特色菜肴码表:code_goods <~ 用来描述加盟店的特色菜肴信息描述
客户受学历码表:code_education <~ 用来描述顾客的学历信息
客户E-mail信息码表:code_email_suffix <~ 用来描述顾客的邮箱的后缀信息
用户访问模型表(基于上述基础)
user_basic: 将用户的基本信息表(user)和用户的扩展表(user_extend)进行合并形成用户宽表
user_visit: 用户访问模型表,用户的访问日志信息,统计指标(中间结果表)-app端的指标,pc端的指标,综合指标
用户订单模型(基于上述基础)
订单分析,下单区域分布
访问情况时段统计图(横坐标是时间点,纵坐标是访问次数)
当天访问用户top20(柱形图形式显示当太难访问用户得top20,横坐标用户登陆名,纵坐标pv量)
订单情况时段统计图(将指定日期的每个时间区间的订单统计情况进行图形展示,横坐标是时间点,纵坐标是下单数量)
当天区域下单量的分布图(以地图的方式显示当天下单金额的各省份的分布图)



技术选型

数据导入导出:SQOOP
数据分析计算:SparkSQL或者Hive on spark
数据仓库:Hive
任务调度:Azkaban

猜你喜欢

转载自blog.csdn.net/weixin_42969976/article/details/86520078