Hive表的存储格式

cdh中使用的大表用orc

抽取出去展示的用text

直接抽取过来数据量很大的表比如扫描表一天三个多亿,进出港操作明细一天一亿多,那么肯定要存orc格式的高压缩比

但是结果表要抽取出去做展示的要存为text格式,高压缩比的表解压消耗内存资源

猜你喜欢

转载自blog.csdn.net/someInNeed/article/details/114323326