Hadoop-HBase集群搭建

随着数据的增大,传统的关系型数据库对于上千万或者上亿的数据处理,效率会迅速下降。同样是为了解决大数据处理问题,hbase也是基于分布式,这种依靠列存储的方式,使得数据处于非结构化或者半结构化,便于数据的大量操作。

  • hadoop生态架构
    enter description here

  • 数据提取工具:

    • flume:收集日志,从日志中提取数据
    • sqoop:从结构化存储器中提取数据
  • 数据处理工具:

    • mahout:数据挖掘/机器学习开发库
    • pig:将其他语言转化为mapreduce处理
    • hive:将sql语言转化为mapreduce处理
      *核心架构:
    • mapreduce:分布式计算框架
    • hbase:分布式数据库
    • hdfs:分布式文件系统
  • zookeeper:分布式协作服务,保证高可用,备份等

  • Hbase集群架构
    enter description here

    • 基础:hadoop集群搭建完成
    • hbase安装包:hbase-1.1.3-bin.tar.gz
  • 步骤:参照官方文档5.hbase官网

    • 解压安装包到指定目录
    • 修改配置:hbase-env.sh
      • 配置java_home 和 export HBASE_MANAGES_ZK=false
      • 配置export HBASE_CLASSPATH=/home/hadoop-2.5.1/etc/hadoop/,这里是hadoop配置文件的路径
    • 配置hbase-site.xml

      <property>
      <name>hbase.rootdir</name>
      <value>hdfs://node1:8020/hbase</value>
      </property>
      <property>
      <name>hbase.cluster.distributed</name>
      <value>true</value>
      </property>
      <property>
      <name>hbase.zookeeper.quorum</name>
      <value>node1,node2,node3</value>
      </property>
      
    • 配置reginservers,数据节点:修改文件reginservers

      node1
      node2
      node3
    • 配置完成,复制到node2,node3,使所有环境变量生效

    • 启动:start-hbase.sh
      enter description here
  • phonenix安装

    由于hbase自身对一些功能不支持,所以,通过phonenix来实现。具体为:phoenix最主要给HBase添加了二级索引、SQL的支持。

    • 解压相应的包 ,比如phoenix-4.5.2-HBase-1.1-bin.tar.gz
    • 将解压后的包里的phoenix-core-4.5.2-HBase-1.1.jar拷贝到集群各个节点HBase的lib目录下。这里的包看版本了,记住前缀是phoenix-core的包,如果这里有phonenix旧的包需要先删掉
    • 重启hbase集群
    • bin/sqlline.py node1:2181,如下,表示成功
      enter description here

猜你喜欢

转载自blog.csdn.net/SoundSlow/article/details/80285384