Hive学习篇01

一、Hive的元数据库的备份与还原
常见错误:启动Hive时,无法初始化metastore数据库,无法创建连接,无法创建会话。
 可能性分析:
1、hive的metastore数据库丢失了,比如drop,比如文件损坏
2、metasotre版本号不对。
3、远程表服务
备份的基本语法:$ mysqldump -uroot -p metastore > metastore.sql
还原的基本语法:$ mysql -uroot -p metastore < metastore.sql

二、Hive操作HQL语句的两个参数
 一般使用:
oozie
azakban
crontab
hive -e ""
hive -f 文件.hql

三、Hive历史命令存放地
cat ~/.hivehistory        主要用于排查逻辑错误或者查看常用命令

四、Hive的内部表与外部表
伪代码:
hive> CREATE TABLE custom_table(id int, name string)  location '/custom/z/hive/somedatabase'
默认情况:inner
hive> CREATE INNER TABLE(报错)
显示指定:external
hive> CREATE EXTERNAL TABLE

内部表:
删除表数据时,连同数据源以及元数据信息同时删除
外部表:
1、只会删除元数据信息。
2、共享数据,外部表相对而言也更加方便和安全。

相同之处:如果你导入数据时,操作于HDFS上,则会将数据进行迁移,并在metastore留下记录,而不是copy数据源

五、HiveServer2

配置:hive-site.xml
                hive.server2.thrift.port --> 10000
                hive.server2.thrift.bind.host --> hadoop-senior01.itguigu.com
                hive.server2.long.polling.timeout -- > 5000(去掉L)
            检查端口:
                $ sudo netstat -antp | grep 10000
            启动服务:
                $ bin/hive --service hiveserver2
            连接服务:
                $ bin/beeline
                beeline> !connect jdbc:hive2://hadoop-senior01.itguigu.com:10000

扫描二维码关注公众号,回复: 5174623 查看本文章

六、UDF

向maven项目添加如下代码:

<dependency>
<groupId>org.apache.hive</groupId>
<artifactId>hive-jdbc</artifactId>
<version>0.13.1</version>
</dependency> 
<dependency>
<groupId>org.apache.hive</groupId>
<artifactId>hive-exec</artifactId>
<version>0.13.1</version>
</dependency>

猜你喜欢

转载自blog.csdn.net/qq_40310148/article/details/87475460