Hive的特点有一下几点:
1.为超大数据集设计的计算/拓展能力-based on Hadoop
2.支持SQL like查询语言
3.统一的元数据管理
Hive与SQL类似,使用的语句区别不大,如:
select word,count(*) from(select expolde(split(sentence,' '))) word from article) t group by word;
Hive的数据类型有以下分类:
原始类型:int/bigint/smallint/tinyint/boolean/double/float/string
数组类型:Array
映射:Map
结构:Struct
备注:原始类型长度跟平常的大小无异,其中HiveQL没有date/datetime类型