Hive的数据类型和DDL
重点是hive 的建表语句和分区
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL
建表 最简单的列子
CREATE TABLE people(
id STRING,
name STRING,
likes ARRAY<string>,
addr MAP<string,string>
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
COLLECTION ITEMS TERMINATED BY ','
MAP KEYS TERMINATED BY ':'
STORED AS TEXTFILE;
1 zs game,gril,money stuAddr:changsha,workAddr:beijing
1 ls game,gril,money stuAddr:changsha,workAddr:beijing
load data local inpath '/opt/sxt/temp/test.txt' into table people;
分区 最简单的列子-- 会影响mapReduce效率
有分区了
Hive的数据加载和DML--增删改查 hive主要搞查询
重点是数据加载和查询插入语法
数据转移-- people数据转移到people_test-- 单个数据 启用mapreduce 速度很慢相对于关系型数据库
zs的数据已经复制进去
update和delete默认不支持 需要添加配置
内表和外表External 之间的区别
内表会更新 hdfs数据 外表不会(理解即可)