Spark sql理论简介

其他 2019-04-18 00:00:51 阅读次数: 0

版权声明：版权声明中 https://blog.csdn.net/lds_include/article/details/89298544

Spark sql简介

什么是spark sql

Spark SQL是Spark用来处理结构化数据的一个模块，它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。

了解Spark Sql的必要性

我们知道hive，它是将Hive SQL转换成MapReduce然后提交到集群上执行，大大简化了编写MapReduce的程序的复杂性，由于MapReduce这种计算模型执行效率比较慢。所有Spark SQL的应运而生，它是将Spark SQL转换成RDD，然后提交到集群执行，执行效率非常快！

特性

1.易整合
2.统一的数据访问方式
3.兼容Hive
4.标准的数据连接

优点

1、用到了内存列存储–可以大大优化内存使用效率，减少了内存消耗，避免了gc对大量数据性能开销
2、字节码生成技术（byte-code generation）–可以使用动态字节码生成技术优化新能（也可以理解成是通过sql语句生成scala代码的技术）
3、Scala代码的优化

猜你喜欢

转载自blog.csdn.net/lds_include/article/details/89298544

Spark sql理论简介

spark-SQL理论

Spark-SQL简介

Spark SQL 架构简介

Spark SQL的简介_体验

Spark SQL的简介_体验

Spark SQL简介

Spark SQL和Spark Streaming简介

Spark -- Spark SQL 简介数据抽象

Spark SQL—1—简介、应用

【SPARK】Spark Streaming简介

spark笔记-spark sql

Spark简介

spark 简介

【Spark】简介

Spark SQL

Spark、Python spark、Hadoop简介

Spark-01 spark简介

Spark 系列（一）—— Spark 简介

Spark 系列（一）—— Spark简介

Hive on Spark 与Spark SQL比较

Spark之spark.sql

Spark基础：（六）Spark SQL

Spark 04 Spark SQL 使用

spark基础六 spark SQL

Spark 03 Spark SQL 概述

Spark-Spark SQL and DataFrame

Spark SQL与Hive on Spark的比较

Spark学习之Spark SQL

Spark学习笔记：Spark SQL

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)