Presto 介绍 - 代码天地

Presto 介绍

其他 2021-03-06 10:17:35 阅读次数: 0

Presto 是由 Facebook 开发的开源大数据分布式高性能 SQL 查询引擎；它被设计为用来专门进行高速、实时的数据分析，以弥补 Hive 在速度和对接多种数据源上的短板；专门为交互式查询所设计，提供分钟级乃至亚秒级低延时的查询性能。

1.1 Presto 架构

Presto 是典型的 MPP 架构，由一个 Coordinator 和多个 Worker 组成，其中 Coordinator 负责 SQL 的解析和调度，Worker 负责任务的具体执行。可配置多个不同类型的 Catalog，实现对多个数据源的访问。

1.2 Presto 执行查询过程

Client 发送请求给 Coordinator。
SQL 通过 ANTLR 进行解析生成 AST。
AST 通过元数据进行语义解析。
语义解析后的数据生成逻辑执行计划，并且通过规则进行优化。
切分逻辑执行计划为不同 Stage，并调度 Worker 节点去生成 Task。
Task 生成相应物理执行计划。
调度完后根据调度结果 Coordinator 将 Stage 串联起来。
Worker 执行相应的物理执行计划。
Client 不断地向 Coordinator 拉取查询结果，Coordinator 从最终汇聚输出的 Worker 节点拉取查询结果。

1.3 Presto 为何高性能

Pipeline, 全内存计算。
SQL 查询计划规则优化。
动态代码生成技术。
数据调度本地化，注重内存开销效率，优化数据结构，Cache，非精确查询等其它技术。

1.4 Presto优化

Coordinator 节点不作为计算节点，只作为协调节点；
每台物理机只部署一个 Presto 节点，无其他任何竞争服务；
JVM 配置为 G1 回收器、最大堆内存为物理内存的 75%；
设置堆外内存最大使用量 MaxDirectMemorySize；
设置 glibc 的参数 export MALLOC_ARENA_MAX=1 ；

猜你喜欢

转载自blog.csdn.net/qq_42979842/article/details/111771276

Presto 介绍

Presto入门介绍

Presto安装介绍及使用

大数据之Presto 介绍

Presto

Presto的介绍、使用和原理架构

Presto学习之路 -- 01.整体介绍

分布式SQL查询引擎Presto原理介绍

用户认证-Kerberos的介绍和使用(Hadoop、Hive、数仓流程、Presto、Kylin集成配置)

presto测试

Presto随笔

presto configuration

presto小记

Presto 文档

presto导数

presto 相关

presto原理

presto数组

Presto安装

presto的升级

Presto部署

Presto-[16]-Presto UDFs开发

《Presto系列文章-CHAPTER 4 Presto Architecture》

结合Presto CLI，Presto Client学习

Presto性能优化

Centos 6.9 配置 Presto

presto-use

安装和部署Presto

Presto基本概念

Presto sql 语句

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)