Kylin 与 Spark SQL相比，有哪些差异和优势 - 代码天地

Kylin 与 Spark SQL相比，有哪些差异和优势

其他 2018-07-05 10:15:50 阅读次数: 0

SparkSQL本质上是基于DAG模型的MPP。而Kylin核心是Cube(多维立方体)。关于MPP和Cube预处理的差异，重复如下：

>
MPP [1]
的基本思路是增加机器来并行计算，从而提高查询速度。比如扫描8亿记录一台机器要处理1小时，但如果用100台机器来并行处理，就只要一分钟不到。再配合
列式存储和一些索引，查询可以更快返回。要注意这里在线运算量并没有减小，8亿条记录还是要扫描一次，只是参与的机器多了，所以快了。

>
MOLAP Cube [2][3]
是一种预计算技术，基本思路是预先对数据作多维索引，查询时只扫描索引而不访问原始数据从而提速。8亿记录的一个3维索引可能只有几万条记录，规模大大缩
小，所以在线计算量大大减小，查询可以很快。索引表也可以采用列存储，并行扫描等MPP常用的技术。但多维索引要对多维度的各种组合作预计算，离线建索引
需要较大计算量和时间，最终索引也会占用较多磁盘空间。

除
了有无预处理的差异外，SparkSQL与Kylin对数据集大小的偏好也不一样。如果数据可以基本放入内存，Spark的内存缓存会让SparkSQL
有好的表现。但对于超大规模的数据集，Spark也不能避免频繁的磁盘读写，性能会大幅下降。反过来Kylin的Cube预处理会大幅减小在线数据规模，
对于超大规模数据更有优势。

猜你喜欢

转载自www.cnblogs.com/qqflying/p/9266773.html

Kylin 与 Spark SQL相比，有哪些差异和优势

Kylin配置Spark并构建Cube

35-Spark Streaming反压机制、Spark的数据倾斜的解决和Kylin的简单介绍

大数据Storm相比于Spark、Hadoop有哪些优势(摘录)

大数据Storm相比于Spark、Hadoop有哪些优势

Apache Kylin Spark Cubing on Kubernetes 初探

Kylin 配置使用 Spark 构建 Cube

Kylin(SQL on HBase)

kylin SQl查询

kylin

Storm与Spark，Hadoop相比是否有优势

hive表，hive视图，spark处理数据入mysql，shell获取url数据下载json,Spark sql处理json,shell脚本执行kylin,azkaban任务调度

Kyligence 架构师:Spark tunning in Apache Kylin

kylin启动 -printf: unknown primary or operator spark jars not found

Kylin介绍以及环境搭建（安装、整合Spark引擎）

Apache Kylin的安装和使用

Spark相比Hadoop MapReduce的优势

Kylin 几个sql报错原因汇总

Kylin介绍（很有用）

【转】Kylin介绍（很有用）

Kylin存储和查询的分片问题

Ubuntu kylin安装opengl和Pangolin

Kylin之概述和环境搭建

spark的特性和mapreduce和spark相比

Ubuntu kylin 16.04 之 spark 2.1.1集群搭建详细教程

Hadoop Spark Kylin...你知道大数据框架名字背后的故事吗？

大数据不就是写sql吗？—— Hive：把sql解析后用MapReduce跑 SparkSQL：把sql解析后用Spark跑，比hive快点 Drill/Impala/Presto：交互式查询OLAP Druid/Kylin：强调预计算，同样是OLAP

kylin --Kylin Cube优化

spark的优势

spark笔记-spark sql

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)