Hive Job层面的优化 - 代码天地

Hive Job层面的优化

编程语言 2018-11-23 11:26:25 阅读次数: 0

1. Run in Local Mode

数据处理比较小的时候就运行本地模式，

不需要分布式。

把阀值这三个设置改一下就是本地模式了。

2. JVM Reuse

Hadoop每当得到一个map或者reduce任务的时候，

就会启动一个新的JVM。

处理job时间比较短，但是启动JVM太费时了。

配置成JVM Reuse可以大大优化

3. Parallel Exectution 并行执行

这个很常用的，默认是关闭的。

hive很多阶段是可以并行执行的，

并不是每个阶段都互相依赖，

如果集群中资源利用效率不高，可以考虑开启此选项。

4. 查询优化

（1）map side join 设置为enable

（2）bucket map side join 也设置为enable

以上两种都是基于bucket来优化，务必开启。

（3）skewjoin也可以开启为true

有数据倾斜时，就重新分配。

（4）CBO（一个很棒的执行优化器）

set hive.cbo.enable=true; 开启CBO

然后你可能就要收集状态，所以status也设置为true。（见下图）

这几个都要开启。

基于cost的优化

（5）vectorized

基于向量的优化，和基于cost的优化不冲突

一般这两个选项也是开启的，默认是开启的。

作用是hive做数据扫描的时候会按照1024rows来批量扫描，这样性能大大提高。

其他优化：

CTE:code尽量用CTE，这样好理解。

Common Table Expression

临时表可以共用，省去很多重复步骤。

windows functions比group by好多了，

这样你可以用简单的query实现复杂的功能。

总结：

了解了事务的概念

会使用增删改查，演示了一个merge的例子

了解了HPLSQL

了解了性能优化的一些技巧

从设计角度和从job角度

猜你喜欢

转载自blog.csdn.net/u011495642/article/details/84331589

Hive Job层面的优化

hive 多个方面的优化

Hive --------- hive 的优化

[Hive进阶]-- Hive 优化

（hive）hive优化（转载）

Hive_HIVE优化指南_场景二_减少JOB的数量

hive优化

Hive 优化

Hive的优化

Hive 的优化

Hive之——Hive SQL优化

Hive（十）Hive 压缩与优化

Hive总结篇及Hive的优化

【Hive】（十七）Hive 优化策略

【Hive】(六) Hive 优化策略

[Hive]Hive常用的优化方法

hive job oom

hive并行执行job

查看hive job的log

Sqoop之hive的job

hive优化（浅层优化）

java代码层面的优化

hive sql 卡在提交JOB

Hive学习（三）---hive的DML,DLL以及hive的优化

hive in/not in替换以及hive join优化

【Hive十一】Hive数据倾斜优化

开发高效的hive程序，hive优化

Hive学习(三)操作Hive的方式及优化

Hive解决数据倾斜问题及Hive优化

[Hive_8] Hive 设计优化

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)