完全分布式Hadoop集群安装Phoenix

原文地址为: 完全分布式Hadoop集群安装Phoenix

应用场景

当我们按照之前的博文,安装完Hadoop分布式集群之后,再安装了Hbase,当准备通过hbase shell命令开始使用Hbase的时候,发现hbase非常的难用,都是一些scan,status,describe命令等,无法像mysql,oracle,hive等通过一些简单的SQL语句来操作数据,但是通过Phoenix,它可以让Hbase可以通过SQL语句来进行操作。并且Phoenix只针对Hbase,所以它的效率比起Impala,HQL有过之而无不及!

操作步骤

1. Phoenix介绍

可以把Phoenix理解为Hbase的查询引擎,phoenix,由saleforce.com开源的一个项目,后又捐给了Apache。它相当于一个Java中间件,帮助开发者,像使用jdbc访问关系型数据库一些,访问NoSql数据库HBase。

phoenix,操作的表及数据,存储在hbase上。phoenix只是需要和Hbase进行表关联起来。然后再用工具进行一些读或写操作。

其实,可以把Phoenix只看成一种代替HBase的语法的一个工具。虽然可以用java可以用jdbc来连接phoenix,然后操作HBase,但是在生产环境中,不可以用在OLTP中。在线事务处理的环境中,需要低延迟,而Phoenix在查询HBase时,虽然做了一些优化,但延迟还是不小。所以依然是用在OLAT中,再将结果返回存储下来。

2. Phoenix安装包下载

phoenix安装包下载地址,下载后上传到主节点的opt目录下!

注:phoenix安装包的下载非常讲究,如果和hbase的版本不匹配,那么可能导致hbase也会失败,导致HRegionServer开启后,1分钟之内自动关闭,很麻烦!上面的安装包针对hbase1.2.X,亲测好用!

phoenix的其他版本下载地址

3. phoenix安装包解压缩更换目录

 # cd /opt
# tar -xzvf apache-phoenix-4.10.0-HBase-1.2-bin.tar.gz
# mv apache-phoenix-4.10.0-HBase-1.2-bin phoenix4.10.0

# chmod 777 -R /opt/phoenix4.10.0 #给phoenix目录授权

4. 修改配置文件

 # vim /etc/profile

export PHOENIX_HOME=/opt/phoenix4.10.0 #在最后两行加上如下phoenix配置
export PATH=$PATH:$PHOENIX_HOME/bin
 # source /etc/profile #使环境变量配置生效

5. 将主节点的phoenix包传到从节点

 # scp -r phoenix4.10.0 root@hadoop1:/opt/
# scp -r phoenix4.10.0 root@hadoop2:/opt/

并且在从节点上将phoenix目录进行授权,添加环境变量!

6. 将hbase-site.xml配置文件拷贝到phoenix的bin目录下【主从节点都需要】

 # cp /opt/hbase1.2.6/conf/hbase-site.xml /opt/phoenix4.10.0/bin/

7. 将phoenix安装包下的包放到hbase的lib目录下【主从节点都需要】

将如下两个jar包,目录在/opt/phoenix4.10.0/下,拷贝到hbase的lib目录,目录在/opt/hbase1.2.6/lib/

 phoenix-4.10.0-HBase-1.2-server.jar
phoenix-core-4.10.0-HBase-1.2.jar

注:全部配置完后需要重启Hbase!

8. 启动phoenix

 # sqlline.py hadoop0,hadoop1,hadoop2:2181

这里写图片描述

 > !tables                 #测试命令

转载请注明本文地址: 完全分布式Hadoop集群安装Phoenix

猜你喜欢

转载自blog.csdn.net/dearbaba_8520/article/details/80880661