大数据技术Hive日常问题总结 (第四篇)

1. hive数据分为哪两块?分别存储在哪?

元数据和数据本身; mysql等关系型数据库 和 hdfs

2. hive的建表SQL语句你们觉得里有哪些内容?(不光光是字段的定义)

定义分区,分隔字符,内外表之分

3. 默认的换行符和分割符是什么?

/t /r

4. 加载数据或本地数据到hive表或者覆盖hive表,语法是什么?

LOAD DATA LOCAL INPATH 'xxx' OVERWRITE INTO TABLE xxxx;

5.hive的执行引擎是mr,请问哪种hive SQL是触发mr job的

带聚合函数,某些insert,还有create table as select

6. create table a as select * from b; 你们觉得有没有mr job?

7. 谈谈你们对分区表的理解? 怎样定义的,怎样加载数据,怎么查询

定义:

CREATE TABLE order_created_partition (
order_number string,
event_time string
)
PARTITIONED BY (event_month string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY "\t";
加载数据:LOAD DATA LOCAL INPATH "/tmp/order_created.txt"
OVERWRITE INTO TABLE order_created_partition
PARTITION (event_month='2017-12');
查询:select * from test1.order_created_partition
where event_month='2017-12';

8. 静态分区表和动态分区表是什么区别?

静态只能自己手动建立分区表 动态可以设置分区字段然后自动分区

9. 查看函数的是什么语法?

desc function xxx

10. (拓展题)hive一般我们用来做数据插入和追加,不会去更新删除数据,那么hive支持这种操作吗?该加什么参数呢?

支持

11.hive哪些sql会触发mr job

带聚合函数,某些insert,还有create table as select

12.create table t as select ...这样的SQL会不会创建mrjob

13.hive的数据分为哪两块 分别存储哪里

元数据和真实数据,分别存储在mysql,hdfs中

14.一般工作中,udf编写是很多的,那么怎样临时生效,永久生效?

临时生效就是add jar,然后create temporary function
          永久生效要registerUDF

15.那么在工作中,一般分区表用的很多,那么一般我们会选择哪些特征值作为分区字段?

时间

16.生产上 分区表 又分为静态分区表和动态分区表,那么区别是什么?怎样实现?

静态根据指定字段和给定值分区,动态分区值在字段里

17.vi命令 从window复盖一个文件内容到Linux的文件,哪些步骤?

命令行模式下输入gg + dG清空文件 注意要在编辑模式复制,如果在命令模式复制,会丢失前几行

18.谈谈对jps理解

jps java进程

19.谈谈对pid文件理解

存储进程id的文件,用来杀进程的时候使用

20.输入一个命令,找不到,not found,请问你们觉得应该怎么办

首先看看命令有没有打错 然后检查环境变量或者find下 实在没有在进行安装

发布了33 篇原创文章 · 获赞 2 · 访问量 2924

猜你喜欢

转载自blog.csdn.net/qq_36690988/article/details/103428420
今日推荐