HBase简单介绍

HBase参考资料:https://www.ibm.com/developerworks/cn/analytics/library/ba-cn-bigdata-hbase/index.html

Hbase在Hadoop中的位置:https://www.zhihu.com/question/27974418 

 HBase 的相关模块

接下来,我们简单的一一介绍下 HBase 中相关模块的作用。

Master

HBase Master 用于协调多个 Region Server,侦测各个 Region Server 之间的状态,并平衡 Region Server 之间的负载。HBase Master 还有一个职责就是负责分配 Region 给 Region Server。HBase 允许多个 Master 节点共存,但是这需要 Zookeeper 的帮助。不过当多个 Master 节点共存时,只有一个 Master 是提供服务的,其他的 Master 节点处于待命的状态。当正在工作的 Master 节点宕机时,其他的 Master 则会接管 HBase 的集群。

Region Server

对于一个 Region Server 而言,其包括了多个 Region。Region Server 的作用只是管理表格,以及实现读写操作。Client 直接连接 Region Server,并通信获取 HBase 中的数据。对于 Region 而言,则是真实存放 HBase 数据的地方,也就说 Region 是 HBase 可用性和分布式的基本单位。如果当一个表格很大,并由多个 CF 组成时,那么表的数据将存放在多个 Region 之间,并且在每个 Region 中会关联多个存储的单元(Store)。

 HBase跟HDFS没有必然的关系,HBASE一个是对数据关系的管理,而HDFS是对文件存储的管理,可以想象如果没有HDFS,HBASE会把用户请求的增加更新删除的数据写到一个固定的目录下,自己除了要维护数据关系外还要维护物理数据的存储和备份,mySQL等很多数据库都是这样。如果有了HDFS,HBASE就可以把要存储的数据发送到HDFS集群上,由HDFS进行分布式存储;如果说有关系,那就是HBASE利用了HDFS,HBASE基于HDFS之上。
 

猜你喜欢

转载自blog.csdn.net/Noreaday/article/details/81179336