hive使用说明DDL和DML

Hive的数据类型和DDL

重点是hive 的建表语句和分区

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL

建表   最简单的列子

CREATE TABLE people(
     id STRING,
     name STRING,
     likes ARRAY<string>,
     addr MAP<string,string>
     )
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
COLLECTION ITEMS TERMINATED BY ','
MAP KEYS TERMINATED BY ':'
STORED AS TEXTFILE;

1    zs    game,gril,money    stuAddr:changsha,workAddr:beijing
1    ls    game,gril,money    stuAddr:changsha,workAddr:beijing

load data local inpath '/opt/sxt/temp/test.txt' into table people;

分区   最简单的列子-- 会影响mapReduce效率

有分区了

Hive的数据加载和DML--增删改查 hive主要搞查询

重点是数据加载和查询插入语法

数据转移-- people数据转移到people_test-- 单个数据 启用mapreduce  速度很慢相对于关系型数据库

zs的数据已经复制进去

update和delete默认不支持  需要添加配置

内表和外表External 之间的区别

内表会更新 hdfs数据  外表不会(理解即可)

 

 

 

猜你喜欢

转载自blog.csdn.net/ttksgxx/article/details/83146292