Hadoop和Hive的关系 - 代码天地

Hadoop和Hive的关系

编程语言 2023-04-08 11:27:00 阅读次数: 0

1.Hadoop是一个能够对大量数据进行分布式处理的软件框架。Hadoop最核心的设计就是hdfs和mapreduce，hdfs提供存储，mapreduce用于计算。
2.Hive是Hadoop的延申。hive是一个提供了查询功能的数据仓库核心组件，Hadoop底层的hdfs为hive提供了数据存储，mapreduce为hive提供了分布式运算。

两者的关系：
hdfs上存储着海量的数据，我们要对这些数据进行计算和分析，则需要使用Java编写mapreduce程序来实现，但Java编程门槛较高，且一个mapreduce程序写起来要几十上百行。
Hive可以直接通过sql操作Hadoop，sql简单易写，可读性强，hive将用户提交的sql解析成mapreduce任务供Hadoop直接运行。过程如下图所示：
在这里插入图片描述
拓展：
1.hive不存储数据，hive只是对数据进行分析计算，以及计算后的结果数据实际存放在分布式系统上，如HDFS；
2.hive某种程度来说也不进行数据计算，只是个解释器，只是将用户需要对数据处理的逻辑，通过sql编程提交后解释成mapreduce程序，然后将这个MR程序提交给yarn进行调度执行。所以实际进行分布式运算的是mapreduce程序。
3.因为hive需要操作hdfs上的数据集，那么它需要知道数据的切分格式，如行列分隔符，存储类型，是否压缩，数据的存储地址等信息。

猜你喜欢

转载自blog.csdn.net/weixin_43222191/article/details/126829112

Hadoop和Hive的关系

Hive和Hadoop及RDBMS关系

Mysql和Hadoop+Hive有什么关系？

Hadoop、Hbase、Hive和zookeeper版本匹配关系

spark面试题1:Hadoop和Spark 、Hive的关系

Hadoop、Hive、Spark 之间关系

Impala和Hive的关系

hive 和 Hadoop 浅析

hadoop、hbase、hive、zookeeper版本对应关系

hadoop，hive，spark的关系是什么

大数据----Hadoop、Hive、Spark 之间关系

Hadoop、Hive、Spark是什么关系

ma-hadoop集群-配置文件-进程地址端口-和hive hbase关系

Hadoop生态圈-hive动态分区-sql语句和MR流程对应关系

Hadoop、Hive和Spark的具体介绍，它们之间主要有什么关系？

大数据技术生态圈：Hadoop，hive，spark区别和关系

Spark和Hadoop关系

[转帖]Hadoop、Hive、Spark 之间关系 Hadoop、Hive、Spark 之间关系

Impala和Hive的关系（详解）

【转】Impala和Hive的关系

Hadoop和Hive配置压缩

初识Hadoop、Hive和HBase

Hadoop和云计算的关系

Hadoop MapReduce和Yarn的关系

Spark和Hadoop之间的关系

Hadoop、Hive、Spark 之间是什么关系？

Spark-Hadoop、Hive、Spark 之间是什么关系？

impala和hive的关系和应用

Hive学习笔记 --- Hive外部表和内部表的关系

greenplum + pgsql和Hadoop+hive+hbase

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

学习笔记(01):Python入门教程-计算机如何区分数字和字符

命令行提示符_颜色

五步轻松搞定Linux下的文件同步(备份)

Visio 2010，如何打开多个窗口

西安新起点|MBA考研十大热门城市

BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation

【蓝桥杯】ADV-73 数组输出

[DeeplearningAI笔记]卷积神经网络4.11一维和三维卷积

Java 逻辑运算符

Python爬虫入门——2. 5 利用正则表达式爬取豆瓣电影 Top 250

每日归档

更多

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)