Hive学习—调优&其他文件格式和压缩方法&开发&函数

第10章调优

HiveQL是一种声明式语言，用户会提交声明式的查询，而Hive会将其转换成MapReduce job。
**10.1 使用EXPLAN **
10.2 EXPLAN EXTENDED
10.3 限制调整
10.4 JOIN优化
将最大的表放置在JOIN语句的最右边。
如果所有表中有一个表足够小，是可以完成载入到内存中，那么Hive可以执行一个map-side JOIN，这样可以减少reduce过程，有时甚至可以减少某些map task任务。
10.5 本地模式
10.6 并行执行
10.7 严格模式
对于ORDER BY 语句的查询，要求必须使用LIMIT语句。因为ORDER BY为了执行排序过程会将所有的结果分发到同一个reducer中进行处理，强制要求用户增加这个LIMIT语句可以防止reducer额外执行很长一段时间。
10.8 调整mapper和reducer个数
10.9 JVM重用
10.10 索引
10.11 动态分区调整
10.12 推测执行

Hive学习—调优&其他文件格式和压缩方法&开发&函数

第10章调优

第11章其他文件格式和压缩方法

第12章开发

第13章函数

猜你喜欢

Hive学习—调优&其他文件格式和压缩方法&开发&函数

第10章 调优

第11章 其他文件格式和压缩方法

第12章 开发

第13章 函数

猜你喜欢

第10章调优

第11章其他文件格式和压缩方法

第12章开发

第13章函数