数据中台解析Hive SQL过程 - 代码天地

数据中台解析Hive SQL过程

其他 2019-03-18 21:54:41 阅读次数: 0

一、数据中台解析SQL的目的：

数据中台需要对外提供数据特征查询的能力，因此中台查找并解析各个平台的sql，找出哪些表中的字段经常被使用，以便沉淀为特征，而我们要做的是找出sql中的数据表及其字段。以海象平台调度任务中的Hive SQL为例，看一下处理一个hive SQL都需要做什么。

二、预处理：

一个sql中会包含很多与查询操作不相关的语句：

1. 注释，包括--和#两种注释；

2. add jar;

3. alter table;

4. create temporary function，定义临时函数;

5 海象中的系统参数;

在预处理阶段，我们通过正则表达式把这些字段全部过滤掉。

三、CTE语法：

hive sql中会经常出现形如with as的CTE表达式，在解析SQL时可能对我们有影响，因此需要把CTE中临时创建的表给屏蔽掉。

抽象语法树：

<dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-exec</artifactId>
            <version>2.2.0</version>
 </dependency>

hive中有解析sql模块的，我们直接引入jar包调用就好。

四、访问者模式：

对于解析SQL来说，访问者模式最大的特点是遍历语法树和解析语法树节点操作分析，符合面向对象中的开闭原则。

如何处理SQL中的子查询？

将QueryNode分割，使得每一个QueryNode下都没有其他的QueryNode。

如何找到字段和表名间的联系？

依靠表别名。

猜你喜欢

转载自www.cnblogs.com/yujinghui/p/10555253.html

数据中台解析Hive SQL过程

【原创】大数据基础之Hive（2）Hive SQL执行过程之SQL解析过程

Hive SQL的编译过程

Hive sql编译过程

SQL语句解析过程

SQL语句的解析过程

SQL 语句的解析过程

sql中的存储过程

Hive SQL编译过程 & 优化

Hive SQL编译过程（转）

iBATIS 对 SQL 语句的解析过程

SQL语句的解析过程(转)

【转载】SQL语句的解析过程

SQL　解析过程及效率提升

图解spark sql解析过程

SQL 语句解析过程详解

SQL 中存储过程的使用

Spring 中 SQL 的存储过程

Hive存储过程HQL/SQL（二）– 在Hive存储过程中读写MySQL表

Hive将SQL转化为MapReduce的过程

SQL语句的解析过程大剖析

Mybatis源码解析-Mapper执行SQL过程

详细实例全面解析SQL存储过程

Spark SQL 解析-转换-执行过程

sql的执行过程-解析、执行、返回

openGauss内核：SQL解析过程分析

GaussDB SQL查询语句执行过程解析

一次SQL优化过程中的分析过程

SQL中存储过程和函数的区别

mysql中SQL执行过程详解

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)