hive表之桶表

hive表之桶表
桶表是对数据进行哈希取值后,对桶数取余,根据余数放到不同的文件中进行存储,比如可以针对表中某一列进行哈希,这样可以降低系统的热块,提高查询速度
举例 
hive>create table bucket_table(sid int,sname string,age int) cluster by(sname) into 5 buckets;    

猜你喜欢

转载自blog.csdn.net/lepton126/article/details/80046194