1. hive数据分为哪两块?分别存储在哪?
元数据和数据本身; mysql等关系型数据库 和 hdfs
2. hive的建表SQL语句你们觉得里有哪些内容?(不光光是字段的定义)
定义分区,分隔字符,内外表之分
3. 默认的换行符和分割符是什么?
/t /r
4. 加载数据或本地数据到hive表或者覆盖hive表,语法是什么?
LOAD DATA LOCAL INPATH 'xxx' OVERWRITE INTO TABLE xxxx;
5.hive的执行引擎是mr,请问哪种hive SQL是触发mr job的
带聚合函数,某些insert,还有create table as select
6. create table a as select * from b; 你们觉得有没有mr job?
有
7. 谈谈你们对分区表的理解? 怎样定义的,怎样加载数据,怎么查询
定义:
CREATE TABLE order_created_partition (
order_number string,
event_time string
)
PARTITIONED BY (event_month string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY "\t";
加载数据:LOAD DATA LOCAL INPATH "/tmp/order_created.txt"
OVERWRITE INTO TABLE order_created_partition
PARTITION (event_month='2017-12');
查询:select * from test1.order_created_partition
where event_month='2017-12';
8. 静态分区表和动态分区表是什么区别?
静态只能自己手动建立分区表 动态可以设置分区字段然后自动分区
9. 查看函数的是什么语法?
desc function xxx
10. (拓展题)hive一般我们用来做数据插入和追加,不会去更新删除数据,那么hive支持这种操作吗?该加什么参数呢?
支持
11.hive哪些sql会触发mr job
带聚合函数,某些insert,还有create table as select
12.create table t as select ...这样的SQL会不会创建mrjob
会
13.hive的数据分为哪两块 分别存储哪里
元数据和真实数据,分别存储在mysql,hdfs中
14.一般工作中,udf编写是很多的,那么怎样临时生效,永久生效?
临时生效就是add jar,然后create temporary function
永久生效要registerUDF
15.那么在工作中,一般分区表用的很多,那么一般我们会选择哪些特征值作为分区字段?
时间
16.生产上 分区表 又分为静态分区表和动态分区表,那么区别是什么?怎样实现?
静态根据指定字段和给定值分区,动态分区值在字段里
17.vi命令 从window复盖一个文件内容到Linux的文件,哪些步骤?
命令行模式下输入gg + dG清空文件 注意要在编辑模式复制,如果在命令模式复制,会丢失前几行
18.谈谈对jps理解
jps java进程
19.谈谈对pid文件理解
存储进程id的文件,用来杀进程的时候使用
20.输入一个命令,找不到,not found,请问你们觉得应该怎么办
首先看看命令有没有打错 然后检查环境变量或者find下 实在没有在进行安装