文章目录
HBase简介
HBase是面向列的分布式数据库,能够快速检索大规模数据集,是Hadoop大数据生态系统的一部分。
列式存储相对于传统关系型数据库的行数存储来说,存储表的方式不同。行式存储每行的数据连续存储,INSERT/UPDATE容易。但是查询时即使只查询几列,行数据的所有的列都会读取,而列式存储每列的数据存在一起,由于每列的数据类型相同,便于压缩,也可按需读取。
HBase支持水平分区,而传统的关系型数据库分区会破坏ACID(Atomicity原子性、Consistency一致性、Isolation隔离性、Durability持久性)。HBase不支持复杂的SQL查询。
环境准备
JDK1.8以上
HBase 1.2.6
从官网下载hbase-1.2.6-bin.tar.gz
http://hbase.apache.org/downloads.html
http://archive.apache.org/dist/hbase/
安装模式
包括独立模式、伪分布式、完全分布式。独立模式用于测试HBase shell。
本文采用伪分布式安装,安装在一台机器上。
安装配置
解压安装包
cd /opt/
tar zxf XXXXX/hbase-1.2.6-bin.tar.gz
#XXXXX 为下载的文件完整路径
配置文件
hbase-env.sh
cd /opt/hbase-1.2.6/conf
vi hbase-env.sh
添加以下后保存
export JAVA_HOME=/usr/java/jdk1.8.0_181/
hbase-site.xml
vi hbase-site.xml
添加以下:
<configuration>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.rootdir</name>
<value>hdfs://localhost:9000/hbase</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/opt/hbase-1.2.6/data/zookeeper</value>
</property>
</configuration>
配置环境变量
vi /etc/profile
末尾追加:
export HBASE_HOME=/opt/hbase-1.2.6
export PATH=:$HBASE_HOME/bin:$PATH
保存后使环境变量生效
source /etc/profile
启动伪分布式
启动本机服务
由于没有安装集群,直接在本地启动
start-hbase.sh
再使用jps命令查看进程
jps
出现HMaster则为成功。默认会启动zookeeper。
如果启动不成功,请检查/etc/hosts文件中的IP配置。
如要停止:
start-hbase.sh
Web访问界面
查看服务端口
netstat -an| grep 160
在浏览器输入 http://XXX.XXX.XXX.XXX:16010 可以查看HBase系统状况(XXX.XXX.XXX.XXX为服务器IP)