Hive与HBase之间的区别和联系 - 代码天地

Hive与HBase之间的区别和联系

其他 2021-11-22 10:33:09 阅读次数: 0

首先要知道Hive和HBase两者的区别，我们必须要知道两者的作用和在大数据中扮演的角色

概念

Hive

1.Hive是hadoop数据仓库管理工具，严格来说，不是数据库，本身是不存储数据和处理数据的，其依赖于HDFS存储数据，依赖于MapReducer进行数据处理。

2.Hive的优点是学习成本低，可以通过类SQL语句（HSQL）快速实现简单的MR任务，不必开发专门的MR程序。

3.由于Hive是依赖于MapReducer处理数据的，因此有很高的延迟性，不适用于实时数据处理（数据查询，数据插入，数据分析），适用于离线数据的批处理。

HBase

1.HBase是一种分布式、可扩展、支持海量数据存储的NOSQL数据库

2.HBase主要适用于海量数据的实时数据处理（随机读写）

3.由于HDFS不支持随机读写，而HBase正是为此而诞生的，弥补了HDFS的不可随机读写。

共同点

hbase与hive都是架构在hadoop之上的。都是用HDFS作为底层存储。

区别

1.Hive是建立在Hadoop之上为了减少MapReduce jobs编写工作的批处理系统，HBase是为了支持弥补Hadoop对实时操作的缺陷的项目。总的来说，hive是适用于离线数据的批处理，hbase是适用于实时数据的处理。

2.Hive本身不存储和计算数据，它完全依赖于HDFS存储数据和MapReduce处理数据，Hive中的表纯逻辑。

3.hbase是物理表，不是逻辑表，提供一个超大的内存hash表，搜索引擎通过它来存储索引，方便查询操作。

4.由于HDFS的不可随机读写，hive是不支持随机写操作，而hbase支持随机写入操作。

5.HBase只支持简单的键查询，不支持复杂的条件查询

关系

在大数据架构中，Hive和HBase是协作关系，这里就举例一种常用的协作关系，具体流程如下图：

流程：

1.Hive创建一张外部表与HBase表关联，因此只需对Hive表进行查询即可，Hive表会自动从关联的HBase表中获取数据

2.采集的数据保存到HBase表，因为HBase表支持随机写操作，这个可以根据业务需求决定

3.Hive通过HSQ语句创建MR任务去处理分析数据

3.MR将分析的结果最终存储到常用的数据库（Mysql数据库）

4.web端从数据库获取数据进行可视化

猜你喜欢

转载自blog.csdn.net/m0_55868614/article/details/121147275

Hive与HBase之间的区别和联系

hive与hbase的联系和区别

Hive与HBase的区别与联系

Hive与Hbase的联系与区别

【转载】hive与hbase的联系与区别

Hbase总结（三）-Hbase与Hive的区别与联系

大数据篇 | Hadoop、HDFS、HIVE、HBase、Spark之间的联系与区别

HDFS、Hbase、MySQL、Redis和hive之间的区别分析

Haddoop中的hdfs、hbase、 hive区别与联系

Hive和HBase的区别

Hive和hbase区别

hIve 和hbase的区别

HBase和Hive的区别

Hive 和 HBase 的区别

Hive 和 HBase 区别

hbase和hive的区别，hbase与mysql的区别

浅谈Hive和HBase有哪些区别与联系及适用场景

Hive和HBase是大数据的重点，但二者的区别联系你了解吗？

HIVE和HBASE区别（转载）

面试：Hbase和Hive的区别

Hive和HBase的区别（转载）

hive和hbase的区别。精辟！

hive与hbase的十大区别与联系

Redis,传统数据库,HBase,Hive区别联系

Hive和Hbase之间的主要区别你知道吗？

HIVE和HBASE的基本介绍，两者之间有什么区别？

hive部分；HBASE部分：hive和HBASE的区别

TCP和UDP之间的区别和联系

httpd和tomcat之间的区别和联系？

HBase 和 Hive 区别和现实运用

今日推荐

“开源信徒”周鸿祎开源360智脑大模型

华为ensp中vrrp虚拟路由器冗余协议原理及配置命令

基于Python爬虫广东广州水酒店宾馆数据可视化系统设计与实现(Django框架) 研究背景与意义、国内外研究现状

知识融合：知识图谱构建的关键技术

文心一言收费还是免费：全面解析其价格策略与服务价值

百万用户通话新风潮：仅需50秒，无界AI让彩铃变身短视频

【STM32项目】基于STM32多传感器融合的新型智能导盲杖设计（完整工程资料源码）

文生视频大模型Sora的复现经验

腾讯云函数计算技术：云原生架构下的Serverless与微服务新篇章

干货分享｜JumpServer 三种常见的文件传输方式效果对比

【榜单公布】2023年度征文活动已结束

周排行

Java中关于时间的操作及格式化

《HTML5与CSS3基础教程》第五章学习笔记图像

nginx下安装PHP发生问题的逐步解决

HDU-1048，The Hardest Problem Ever（字符串处理）

新一代多媒体技术与应用的部分课后题

Shader 绘制特殊图形

Oracle数据库三种备份方案

CodeForces - 983B XOR-pyramid(两次区间DP/记忆化DFS)

Python3基础语法——变量与运算符

（转载）KMP算法详解（原创）详解KMP算法

每日归档

更多

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)

2024-04-08(60)

2024-04-07(4)