Hive安装教程

1.什么是hive

Hive是基于Hadoop的数据仓库解决方案。由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的数据仓库也秉承了这些特性。

简单来说,Hive就是在Hadoop上架了一层SQL接口,可以将SQL翻译成MapReduce去Hadoop上执行,这样就使得数据开发和分析人员很方便的使用SQL来完成海量数据的统计和分析,而不必使用编程语言开发MapReduce那么麻烦。

hive安装之前需要hadoop环境请先安装hadoop

1、下载hive

我这里已经下载好的,可以使用我的。hive对版本兼容性比较高

链接:https://pan.baidu.com/s/1KVCwNhfyx3Wu6g8WsPGKqg 
提取码:vo70 
下载hive——地址:http://mirror.bit.edu.cn/apache/hive/

1、开始安装

2.1、上传hive到服务器任意位置

2.1、 解压hive文件这里以hive-2.1.0为例子

        tar -zxvf apache-hive-2.1.0-bin.tar.gz

 2.3、重名了hive文件为hive

mv apache-hive-2.1.1-bin hive

2.4、修改环境变量vi /etc/profile

 export HIVE_HOME=/usr/local/java/hive(安装路径)

 export PATH=$PATH:$HIVE_HOME/bin

执行source /etc/profile (使文件生效)

执行hive –version

有hive的版本显现,安装成功!

2.5、修改配置文件

切换到hive/conf目录下拷贝 hive-default.xml.template 为 hive-site.xml

修改hive-site.xml 文件

Hive-site.xml文件修改地方比较多,主要是些数据库连接信息(hive存在默认的配置信息,只需要修改即可,如不想拷贝下边内容可以直接把我的hive-site.xml文件拷贝修改即可)

以下需要指定数据连接信息(jdbc:mysql://192.168.2.115:3306/hive  //hive数据库事先必须创建好)

<property>

    <name>javax.jdo.option.ConnectionPassword</name>

    <value>root</value>

    <description>password to use against metastore database</description>

 </property>

  <property>

    <name>javax.jdo.option.ConnectionUserName</name>

    <value>root</value>

    <description>Username to use against metastore database</description>

  </property>

<property>

    <name>javax.jdo.option.ConnectionURL</name>

    <value>jdbc:mysql://192.168.2.115:3306/hive</value>

 </property>

 <property>

    <name>javax.jdo.option.ConnectionDriverName</name>

    <value>com.mysql.jdbc.Driver</value>

    <description>Driver class name for a JDBC metastore</description>

  </property>

 <property>

    <name>hive.exec.local.scratchdir</name>

    <value>/home/centos/hive</value>

    <description>Local scratch space for Hive jobs</description>

  </property>

  <property>

    <name>hive.downloaded.resources.dir</name>

    <value>/home/centos/hive/downloads</value>

    <description>Temporary local directory for added resources in the remote file system.</description>

  </property>

  <property>

    <name>hive.querylog.location</name>

    <value>/home/hive/querylog</value>

    <description>Location of Hive run time structured log file</description>

  </property>

<property>

    <name>hive.server2.logging.operation.log.location</name>

    <value>/home/hive/server2_logs</value>

    <description>Top level directory where operation logs are stored if logging functionality is enabled</description>

  </property>

  <property>

    <name>hive.server2.enable.doAs</name>

    <value>false</value>

    <description>

      Setting this property to true will have HiveServer2 execute

      Hive operations as the user making the calls to it.

    </description>

  </property>

2.6、复制mysql的驱动程序到hive/lib下面(这里已经拷贝好了)

切换到hive/bin目录下执行以下命令生成hive元数据

schematool -dbType mysql -initSchema

hive 命令验证是否安装成功

./hive

成功进入hive界面

2.7、hive命令行操作

1.创建hive的数据库

                  $hive>hive --version                      

                  $hive>hive --help                        

                  $hive>create database mydb2 ;                    

                  $hive>show databases ;

                  $hive>use mydb2 ;

                  $hive>create table mydb2.t(id int,name string,age int);

                  $hive>drop table t ;

                  $hive>drop table mydb2.t ;

                  $hive>select * from mydb2.t ;   //查看指定库的表

                  $hive>exit ;        //退出

2.8、参考资料

https://www.cnblogs.com/kinginme/p/7233315.html

https://www.cnblogs.com/dxxblog/p/8193967.html

猜你喜欢

转载自www.cnblogs.com/ypsy/p/9969225.html