大数据SQL交互查询 presto/spark/mapreduce 计算引擎对比 - 代码天地

大数据SQL交互查询 presto/spark/mapreduce 计算引擎对比

其他 2018-09-18 09:19:22 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/kwu_ganymede/article/details/62434616

presto/spark/mapreduce 计算引擎对比

对比的表结构为146列， 15920816 行数据，数据压缩前的大小15G。

对于执行语句的效率，单位秒

TextFile格式

执行的SQL	presto	spark	mr
SELECT COUNT(*) FROM tmp.mb_crm1	5	9.264	21.711
SELECT sum(lately_land_btw) FROM tmp.mb_crm1;	7	17.23	25.781
SELECT sum(cast(lately_land_btw as bigint)) num,mb_name FROM tmp.mb_crm1 where age>=25 group by mb_name order by num desc	8	20.265	128.811

Parquet格式

执行的SQL	presto	spark	mr
SELECT COUNT(*) FROM tmp.mb_crm1	1	5.255	24.142
SELECT sum(lately_land_btw) FROM tmp.mb_crm1;	1	3.181	42.893
SELECT sum(cast(lately_land_btw as bigint)) num,mb_name FROM tmp.mb_crm1 where age>=25 group by mb_name order by num desc	3	11.486	66.903

可看出presto优势明显，spark次之，mr 最慢。

使用列式储存后，presto提速明显。

猜你喜欢

转载自blog.csdn.net/kwu_ganymede/article/details/62434616

大数据SQL交互查询 presto/spark/mapreduce 计算引擎对比

大数据不就是写sql吗？—— Hive：把sql解析后用MapReduce跑 SparkSQL：把sql解析后用Spark跑，比hive快点 Drill/Impala/Presto：交互式查询OLAP Druid/Kylin：强调预计算，同样是OLAP

大数据平台建设 —— SQL查询引擎之Presto

Spark和Flink的对比(谁是下一代大数据流计算引擎?)

Hive、Sparksql、Presto、Impala、Hawq、Clickhouse、Greenplum大数据查询引擎对比

大数据的分布式SQL查询引擎 -- Presto的详细使用

Spark SQL和 presto 访问数据源的对比分析

大数据spark计算引擎快速入门

Spark大数据计算引擎介绍

大数据查询Druid，Impala，Presto，SparkSQL对比

Presto 0.206 发布，Facebook 开源的大数据查询引擎

Presto 0.220 发布，Facebook 开源的大数据查询引擎

大数据分布式查询引擎Presto

Presto与Spark SQL查询性能比较

大数据处理引擎Spark与Flink对比分析！

大数据处理引擎Spark与Flink对比分析

Spark与Flink大数据处理引擎对比分析！

Spark 和 MapReduce 的对比

spark 与 mapreduce 对比

大数据计算引擎之Spark(2) SparkCore-RDD

大数据技术之分析计算引擎Spark

Presto- facebook数据查询引擎

Python 与大数据：Airflow、 Jupyter Notebook 与 Hadoop 3、Spark、Presto

Presto查询引擎简单分析

Presto查询引擎安装部署

云计算与大数据之间的羁绊（期末不挂科版）：云计算 | 大数据 | Hadoop | HDFS | MapReduce | Hive | Spark

大数据OLAP引擎对比

ROLAP场景下的交互式计算引擎Impala和Presto

分布式SQL查询引擎Presto原理介绍

Presto 分布式SQL查询引擎及原理分析

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)