hive2.3.3安装过程

基础:hadoop2.7.3集群安装好并且能正常启动。zookeeper3.4.6。mysql:5.1都已经安装好。

一、    修改mysql的密码
    /usr/bin/mysql_secure_installation
    (注意:删除匿名用户,允许用户远程连接)
    登陆mysql
    mysql -u root -p

二、配置hive
    cp hive-default.xml.template hive-site.xml 
    修改hive-site.xml(删除所有内容,只留一个<property></property>)
    添加如下内容:
    <property>
      <name>javax.jdo.option.ConnectionURL</name>

<!--hadoop00:你的mysql服务器ip-->
      <value>jdbc:mysql://hadoop00:3306/hive?createDatabaseIfNotExist=true</value>
      <description>JDBC connect string for a JDBC metastore</description>
    </property>

    <property>
      <name>javax.jdo.option.ConnectionDriverName</name>
      <value>com.mysql.jdbc.Driver</value>
      <description>Driver class name for a JDBC metastore</description>
    </property>

<!--mysql用户名下一个是密码--》    

<property>
      <name>javax.jdo.option.ConnectionUserName</name>
      <value>root</value>
      <description>username to use against metastore database</description>
    </property>

    <property>
      <name>javax.jdo.option.ConnectionPassword</name>
      <value>123</value>
      <description>password to use against metastore database</description>
    </property>

安装hive和mysq完成后,将mysql的连接jar包拷贝到$HIVE_HOME/lib目录下
    如果出现没有权限的问题,在mysql授权(在安装mysql的机器上执行)
    mysql -uroot -p
    #(执行下面的语句  *.*:所有库下的所有表   %:任何IP地址或主机都可以连接)
    GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '123' WITH GRANT OPTION;
    FLUSH PRIVILEGES;

然后初始化,在hive的bin目录下:
    初始化:./schematool -dbType mysql -initSchema

最后进入hive:./hive

普通的问题大部分都有答案。这里介绍一个错误,如果你碰到的好不防试一下:

在运行./hive时可能会出现一直运行的情况,如下:

或者hive虽然启动起来了但是运行命令时又碰到上述情况。此时你可以查看logs日志。存放位置为(此处为摘录):

Hive中的日志分为两种
1. 系统日志,记录了hive的运行情况,错误状况。
2. Job 日志,记录了Hive 中job的执行的历史过程。

系统日志存储在什么地方呢 ?
在hive/conf/ hive-log4j.properties 文件中记录了Hive日志的存储情况,
默认的存储情况:

hive.root.logger=WARN,DRFA
hive.log.dir=/tmp/${user.name} # 默认的存储位置
hive.log.file=hive.log  # 默认的文件名

Job日志又存储在什么地方呢 ?

//Location of Hive run time structured log file
    HIVEHISTORYFILELOC("hive.querylog.location", "/tmp/" + System.getProperty("user.name")),
默认存储与 /tmp/{user.name}目录下。
你可以通过查看日志分析原因,除了你没有存放mysql驱动外,最大的原因可能是:

在/hive/conf/hive-site.xml中的<property>
          <name>javax.jdo.option.ConnectionURL</name>
          <value>jdbc:mysql://192.168.8.7:3306/hive?createDatabaseIfNotExist=true</value>这个配置。value值必须在一行,就算放不下让它自动换行,你别换。而且不能有空格。

 

几个hive测试实例

建表(默认是内部表)
    create table trade_detail(id bigint, account string, income double, expenses double, time string) row format delimited fields terminated by '\t';
    建分区表
    create table td_part(id bigint, account string, income double, expenses double, time string) partitioned by (logdate string) row format delimited fields terminated by '\t';
    建外部表
    create external table td_ext(id bigint, account string, income double, expenses double, time string) row format delimited fields terminated by '\t' location '/td_ext';

7.创建分区表
    普通表和分区表区别:有大量数据增加的需要建分区表
    create table book (id bigint, name string) partitioned by (pubdate string) row format delimited fields terminated by '\t'; 

    分区表加载数据
    load data local inpath './book.txt' overwrite into table book partition (pubdate='2010-08-22');
    
    load data local inpath '/root/data.am' into table beauty partition (nation="USA");

    
    select nation, avg(size) from beauties group by nation order by avg(size);

   显示表:show tables;

备注:一般安装过程就这样。遇到什么问题解决什么问题。如果想方便的话还可以把hive添加的环境变量。

猜你喜欢

转载自blog.csdn.net/youjiangtengwan1/article/details/83654979