《Hadoop权威指南》第17章（上）： Hive是啥、Hive运行实例

------------恢复内容开始------------

定义: 信息平台可以描述为 "企业吸收、处理、生成信息的行为"与“帮助企业自身加速从经验数据中学习”的“中心”。

Hive是一个建立在Hadoop集群上的数据仓库框架，方便对大规模HDFS数据集进行查询
Hive是Apache项目之一，开源自FaceBook，可以作为一个通用、可伸缩的数据处理平台
Hive可以把SQL查询转换成一系列在Hadoop集群上运行的作业，Hive把数据组织为表，通过这个方式为存储在HDFS上的数据赋予结构，比如元数据（表结构）就存储在metastore数据库中。

tar xzf .....tar.gz
pwd
export HIVE_HOME=~/...-bin
export PATH=$PATH:$HIVE_HOME/bin

基本与mysql一致, hive 启动
小插曲, hadoop需要先启动, ,sbin/hadoop-daemon.sh start ,然后关闭安全模式hdfs dfsadmin -safemode leave
然后还要先启动hive元数据服务,不然会报错
HiveException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient
启动metadata, bin/hive --service metastore &
发生新的异常 MetaException
MetaException(message:Version information not found in metastore. )
到 hive-site.xml中修改: hive.metastore.schema.verification设置成false
发生新的问题,需要配置mysql,发生授权异常/版本兼容升级问题
ERROR 1805 (HY000): Column count of mysql.user is wrong. Expected 45, found 42. The table is probably corrupted
- 管理员身份启动nysql,mysql_upgrade -u root -p 13456 ,执行升级
后续又是各种问题, 一路百度报错信息
- 借鉴链接 https://blog.csdn.net/lz6363/article/details/85019891 一次性全部搞了一遍,可算搞完了hive的运行环境!
运行成功

hive> show tables;
OK
Time taken: 4.56 seconds
hive> show tables;
OK
Time taken: 0.022 seconds
hive>

《Hadoop权威指南》 第17章 （上）： Hive是啥 、Hive运行实例