Hive学习—调优&其他文件格式和压缩方法&开发&函数

第10章 调优

HiveQL是一种声明式语言,用户会提交声明式的查询,而Hive会将其转换成MapReduce job。
**10.1 使用EXPLAN **
10.2 EXPLAN EXTENDED
10.3 限制调整
10.4 JOIN优化
将最大的表放置在JOIN语句的最右边。
如果所有表中有一个表足够小,是可以完成载入到内存中,那么Hive可以执行一个map-side JOIN,这样可以减少reduce过程,有时甚至可以减少某些map task任务。
10.5 本地模式
10.6 并行执行
10.7 严格模式
对于ORDER BY 语句的查询,要求必须使用LIMIT语句。因为ORDER BY为了执行排序过程会将所有的结果分发到同一个reducer中进行处理,强制要求用户增加这个LIMIT语句可以防止reducer额外执行很长一段时间。
10.8 调整mapper和reducer个数
10.9 JVM重用
10.10 索引
10.11 动态分区调整
10.12 推测执行

第11章 其他文件格式和压缩方法

第12章 开发

第13章 函数

猜你喜欢

转载自blog.csdn.net/weixin_43387060/article/details/86769500