大数据环境搭建之HBase伪分布式环境搭建步骤详解

HBase简介

HBase是面向列的分布式数据库,能够快速检索大规模数据集,是Hadoop大数据生态系统的一部分。
列式存储相对于传统关系型数据库的行数存储来说,存储表的方式不同。行式存储每行的数据连续存储,INSERT/UPDATE容易。但是查询时即使只查询几列,行数据的所有的列都会读取,而列式存储每列的数据存在一起,由于每列的数据类型相同,便于压缩,也可按需读取。
HBase支持水平分区,而传统的关系型数据库分区会破坏ACID(Atomicity原子性、Consistency一致性、Isolation隔离性、Durability持久性)。HBase不支持复杂的SQL查询。

环境准备

JDK1.8以上

HBase 1.2.6

从官网下载hbase-1.2.6-bin.tar.gz
http://hbase.apache.org/downloads.html
http://archive.apache.org/dist/hbase/

安装模式

包括独立模式、伪分布式、完全分布式。独立模式用于测试HBase shell。
本文采用伪分布式安装,安装在一台机器上。

安装配置

解压安装包

cd /opt/
tar zxf XXXXX/hbase-1.2.6-bin.tar.gz
#XXXXX 为下载的文件完整路径

配置文件

hbase-env.sh

cd /opt/hbase-1.2.6/conf
vi hbase-env.sh

添加以下后保存

export JAVA_HOME=/usr/java/jdk1.8.0_181/

hbase-site.xml

vi hbase-site.xml

添加以下:

<configuration>
  <property>
    <name>hbase.cluster.distributed</name>
    <value>true</value>
  </property>
  <property>
    <name>hbase.rootdir</name>
    <value>hdfs://localhost:9000/hbase</value>
  </property>
  <property>
    <name>hbase.zookeeper.property.dataDir</name>
    <value>/opt/hbase-1.2.6/data/zookeeper</value>
  </property>
</configuration>

配置环境变量

vi /etc/profile

末尾追加:

export HBASE_HOME=/opt/hbase-1.2.6
export PATH=:$HBASE_HOME/bin:$PATH

保存后使环境变量生效

source /etc/profile

启动伪分布式

启动本机服务

由于没有安装集群,直接在本地启动

start-hbase.sh

再使用jps命令查看进程

jps

出现HMaster则为成功。默认会启动zookeeper。
如果启动不成功,请检查/etc/hosts文件中的IP配置。
如要停止:

start-hbase.sh

Web访问界面

查看服务端口

netstat -an| grep 160

在浏览器输入 http://XXX.XXX.XXX.XXX:16010 可以查看HBase系统状况(XXX.XXX.XXX.XXX为服务器IP)

猜你喜欢

转载自blog.csdn.net/weixin_42628594/article/details/84760557