Hbse 和 Hive 架构的分析

Hbase 架构

宏观架构：Hbase采用Master/Slave 架构搭建集群它隶属于hadoop生态系统由HMaster节点 HRegion Server节点 Zookeeper集群组成而在底层它将数据存储在HDFS中因而涉及到HDFS的NameNode DataNode等
在物理上：Hbase由master/slave类型体系结构中的三种服务器组成 Region Server为读取和写入提供数据访问数据时客户端直接与Region Server通信 Region的分配 DDL(创建删除表)操作由HMaster处理作为HDFS一部分的zookeeper维护活动集群状态 hadoop DataNode存储 Region Server正在管理的数据所有Hbase数据都存储在HDFS文件中 Region Server与HDFS数据节点并置从而为Region Server提供的数据实现数据局部性除了Region在切片的时候 Hbase写入不是本地的但是在Hbase在完成compaction之后 Hbase数据是基于本地写入的 NameNode维护构成文件的所有物理数据块的元数据信息

Region
Hbase 表按Rowkey范围水平划分为“Region” 一个Region包含表中改Region的开始键和结束键之间的所有行将Region分配给群集中称为Region Server的节点这些Region Server为读取和写入提供数据 Region Server可以服务大约1000个区域
Hbase HMaster
区Region 分配 DDL(创建删除表)操作
1. 协调region server
  - 分配regions的启动和为了恢复并且负载均衡重构region
  - 监视所有服务器端在群集里的实体(监听来自zookeeper的通知)
2. 管理功能
  - 创建删除修改表
Zookeeper
zookeeper为Hbase集群提供协调服务它管理着主节点和服务器端的状态并且会在它们宕机时通知给主节点从而主节点可以实现主节点之间的failover(故障转移)或对宕机的服务器端中的主节点集合的修复(将它们分配给其他的服务器) zookeeper集群本身使用一致性协议(PAXOS协议) 保证每个节点状态的一致性

未完…

概念：Hive提供了一个sql命令的操作接口 允许用户可以使用类似sql的Hive的查询语句执行一些离线的sql分析 hive与传统的数据库不同 hive只是构建在hadoop的MapReduce之上的sql解析工具并不参与数据管理和存储 hive中所有的数据都是在运行任务的时候才会真正的加载

在这里插入图片描述

发布了11 篇原创文章 · 获赞 1 · 访问量 300

私信关注