Hive集群环境的搭建

一、Hive简介 
Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的 SQL 查询功能,将类 SQL 语句转换为 MapReduce 任务执行。 

二、环境准备 
zookeeper-3.4.6,hadoop-2.7.2 , mysql-5.7.24-linux-glibc2.12-x86_64
三台机器: master 、slave1、slave2

对于zookeeper集群环境的搭建请参考https://mp.csdn.net/postedit/84201320

对于hadoop集群环境的搭建请参考https://mp.csdn.net/postedit/84405238

对于MySQL的安装请参考https://mp.csdn.net/postedit/84679543

三:hive环境的搭建

1.下载Hive2.1.1安装包 
wget http://www.apache.org/dyn/closer.cgi/hive/ 
或者直接去国内的清华大学 网易等镜像网站下载 
解压至 /app/hive/目录下,这样管理目录更清晰。 

tar -zxvf apache-hive-1.2.1-bin.tar.gz

2.配置环境变量 

vim /etc/profile

让环境变量生效

source /etc/profile

3:修改hive配置文件

cd apache-hive-1.2.1-bin/conf

修改hive-env.sh文件

cp hive-env.sh.template hive-env.sh

将以下内容写入到hive-env.sh文件中

修改log4j文件

cp hive-log4j.properties.template hive-log4j.properties

EventCounter修改成org.apache.hadoop.log.metrics.EventCounter

配置远程登录模式

vim hive-site.xml

将以下信息写入到hive-site.xml文件中

4:配置mysql-connector-java-5.0.3-bin.jar包

cd /lib

通过ftp上传到/lib目录下

查看是否有mysql-connector-java-5.0.3-bin.jar包

ll my*

5:启动hive

cd bin/hive

出现下面的结果则hive集群环境搭建成功。

猜你喜欢

转载自blog.csdn.net/qq_37469055/article/details/84679783
今日推荐