Hive & SparkSQL

其他 2018-05-24 10:31:46 阅读次数: 0

Hive

在 Hadoop 集群上所有数据的访问都是通过 Java 编写的 MapReduce 作业来完成的，这些让 Java 程序员来完成没有问题。

但是对 SQL 程序员来说，写 MapReduce 则非常困难。Hive 的目的就是允许 SQL 能够访问 HDFS 中的数据。

Hive 定义了一个简单的类 SQL查询语言，叫做 HQL。这种语言让用户能用熟悉的 SQL来查询数据，

用 HQL 编写的查询语句通过 Hive 转化成 MapReduce 代码并且通过 Hadoop 来执行。但 HQL 并非完全标准的 SQL。体现在下面几个方面

Hive 不支持不等连接条件
不支持 update 和 delete 语句
不支持事务

Spark SQL

spark sql 本身就是跑在 spark 上，其性能表现比 Hive 要好。 spark SQL 有一个内存计算模型，可以比 MapReduce 进行

磁盘访问的方式快许多。

尽管 Spark SQL 用一种 Hive 查询语言 HQL 来表达，但也有一些在 Hive 上没有的额外功能。

如在整个用户会话期间缓存表数据的能力，相当于一些数据库中的临时表，这些表在内存中，访问速度要快许多。

以上内容节选自《hadoop 生态系统》

猜你喜欢

转载自www.cnblogs.com/reycg-blog/p/9081362.html

Hive & SparkSQL

sparksql\hive on spark\hive on mr

SparkSQL & Spark on Hive & Hive on Spark

sparksql与hive整合

SparkSQL与Hive集成

MapReduce,hive, sparkcore, sparksql,

SparkSQL与Hive on Spark的比较

SparkSQL和hive on Spark

Hive到SparkSql

Sparksql整合HIVE的步骤

sparkSQL，hive on spark ，thriftserver

SparkSql 整合 Hive

hive on spark与sparkSQl共存

SparkSql连接Hive

SparkSQL整合Hive

sparkSQL 整合hive

SparkSQL集成Hive

sparksql结合hive

SparkSQL与Hive交互

SparkSQL读取Hive中的数据

Hive和sparksql中的dayofweek

3.sparkSQL整合Hive

SparkSql集成hive访问hbase

sparkSQL---spark整合hive

Impala presto hbase hive sparksql

07 使用sparksql访问hive

SparkSql连接Hive的各种操作

Hive，Hive on Spark和SparkSQL区别

总结：Hive，Hive on Spark和SparkSQL区别

SparkSQL & Spark on Hive & Hive on Spark[转载]

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)