数据仓库实战教程 - 代码天地

数据仓库实战教程

其他 2021-01-31 12:14:14 阅读次数: 0

数据仓库教程

这里我们做了一份关于整个数仓体系的教程，主要内容体系大家可以看目录，后续满面会完善，欢迎大家关注，一起讨论交流，这份教程的特点有四个

知识体系完善，从数仓的概念、建模、数仓工具的使用、数仓的落地实践都有，还会有很多小案例
使用的技术都是当前企业最常用的技术，版本也是比较新的，不会导致大家看到一个代码，然后一执行发现语法不支持或者废弃掉了
后续的更新也会很及时，不会说更新了一段时间断更了，在更新完大纲之后，我也会不断完善该系列，不断添加新的知识点
创作团队都是在企业一线员工，实战多于理论。

1. 数仓建模

什么是数仓

数仓架构发展史

数仓建模方法论

分层建设理论

数据湖初识

指标体系建设

2. 数仓工具

1. Hive

1.Hive 基础篇

1. 什么是Hive

2. Hive的编译安装

3. Hive表的基础操作

4. Hive数据的组织管理方式

5. Hive内部表和外部表

6. Hive动态分区

7. Hive命令行

8. Hive基本数据类型

9. Hive复合数据类型

10. Hive Streaming

11. Hive关键字

12. Hive函数大全

13. Hive的架构设计

14. Hive架构之HiveServer2

15. Hive的其他语言调用

16. Hive架构服务

17. Hive的严格模式和本地模式

18. Hive的执行引擎

19. Hive视图和物化视图

2.Hive 语法篇

2. like rlike regexp

3. explode 和 lateral view

4. with as和from

5. Order by, Sort by ,Dristribute by,Cluster By

6. grouping sets

7. cube和rollup

8. map join、reduce join、smb join

9. 窗口函数初识 max count sum

10. 窗口函数row_number、rank、dense_rank

11. 窗口函数ntile

12. 窗口函数first_value和last_value

13. 窗口函数lead和lag

14. 窗口函数cume_dist和 percent_rank

15. 窗口函数练习和总结

16. Hive语法之抽样

3.Hive 进阶篇

1. Hive进阶之索引

2. Hive进阶之事务初识

3. Hive进阶之事务深度剖析

4. Hive进阶之执行计划

5. Hive进阶之数据存储格式

10. Hive优化指南

4.Hive 源码篇

5. Hive 实战篇

2. UDF IP 解析

2. 高性能查询引擎

1.Spark-SQL

2.Impala

3.Presto

4.Druid

3.数据同步工具

4. 调度工具

1. 调度工具的使用

2. 调度工具整合

首先我们会创建常用的脚本然后配合配合数仓的SQL 进行数仓的整体的调度，脚本的话我们主要有抽数的脚本、执行SQL的脚本、监控的脚本、发布脚本

当然我们还会引入版本管理工具，管理我们的SQL和脚本，然后进行发布

5. 元数据管理工具

6. 监控工具

7. 报表工具

3. 数仓实战

1. K12赛道Top公司的数仓建设

2. 知名游戏公司的数仓建设

3. 企业级实时数仓建设案例

总结

猜你喜欢

转载自blog.csdn.net/king14bhhb/article/details/111830285

数据仓库实战教程

Hive数据仓库实战

Hive数据仓库实战(详细)

数据仓库之ETL实战

实战-数据仓库构建（四）

实战-数据仓库构建（二）

实战-数据仓库构建（三）

实战-数据仓库构建（一）

大数据开发实战：Hadoop数据仓库开发实战

数据仓库建模指南视频教程|数据仓库视频教程

数据仓库-什么是数据仓库

数据仓库模型分层ODS、DWD、DWM实战

基于Hive数据仓库的标签画像实战

数据仓库实战之3数仓搭建

数据仓库-模型

hello 数据仓库

什么是数据仓库？

数据仓库

数据仓库基础

数据仓库四

数据仓库一

数据仓库简介

什么是数据仓库

数据仓库三

数据仓库二

数据仓库概念

数据仓库组成

数据仓库的定义

oracle 数据仓库

数据仓库相关

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)