hive表之桶表
桶表是对数据进行哈希取值后,对桶数取余,根据余数放到不同的文件中进行存储,比如可以针对表中某一列进行哈希,这样可以降低系统的热块,提高查询速度
举例
hive>create table bucket_table(sid int,sname string,age int) cluster by(sname) into 5 buckets;
桶表是对数据进行哈希取值后,对桶数取余,根据余数放到不同的文件中进行存储,比如可以针对表中某一列进行哈希,这样可以降低系统的热块,提高查询速度
举例
hive>create table bucket_table(sid int,sname string,age int) cluster by(sname) into 5 buckets;