Spark性能优化第六季--Shuffle性能调优 - 代码天地

Spark性能优化第六季--Shuffle性能调优

其他 2019-02-26 17:39:49 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/someby/article/details/83211015

Shuffle性能调优
一、Shuffle性能调优
1.问题：Shuffle output file lost?真正的原因是GC导致的！！！如果GC尤其是Full GC产生通常会导致线程停止工作，此时下一个Stage的Task默认情况下会尝试重试来获取数据，一般重试3
次重试时间为5s，也就是默认情况下15s内如果还是无法抓取数据的话，就会出现Shuffle output file lost的情况，进而会导致Task重试，甚至会导致Stage重试，最严重的是会导致App失败，在此时首先要采用高效的内存数据结构和序列化机制、JVM的调优来减少Full GC的产生；
2.在shuffle的时候，Reducer端获取数据会有一个指定大小的缓存空间，如果内存足够大的情况下，可以适当的增大该缓存空间，否则会spill 到磁盘上，影响效率，此时可以调(增大)spark.reducer.maxSizeInFlight参数
3.在ShuffleMapTask端通常也会增大Map任务写磁盘的缓存，默认情况下是32k；
Spark.shuffe.file.buffer 32k;
4.调整shuffle中读取数据的重试的次数，默认是3次，通常建议增大重试次数
5.调整获取shuffle数据重试的时间间隔，默认5s，强烈建议提高该时间间隔，spark.shuffle.io.retryWait 5s
6.在Reducer端做Aggregation的时候，默认是20%的内存来做Aggregation，如果超出了的大小，就会溢出到磁盘上，建议调大百分比

猜你喜欢

转载自blog.csdn.net/someby/article/details/83211015

Spark性能优化第六季--Shuffle性能调优

Spark性能优化：shuffle调优

Spark性能优化之shuffle调优

四、Spark性能优化：shuffle调优

Spark性能优化 (3) | Shuffle 调优

Spark——性能调优——Shuffle

Spark性能优化指南——数据倾斜和shuffle调优

Spark性能优化篇四：shuffle调优

spark性能调优之shuffle

[spark 面试]Shuffle的性能调优问题

Spark性能调优 Shuffle（二）

Spark性能优化之数据倾斜调优与shuffle调优

spark性能调优指南（四）（shuffle调优）

Spark性能调优之 Shuffle调优（三）

Spark性能调优-Shuffle调优及故障排除篇

第六季HISI

Spark shuffle性能优化

MapReduce shuffle性能调优

Spark性能优化：数据倾斜调优

Spark性能优化：开发调优篇

Spark性能优化：资源调优篇

spark性能优化-数据倾斜调优

Spark性能优化之资源调优

Spark性能优化之开发调优

Spark性能优化 (4) | JVM 调优

Spark性能优化 (2) | 算子调优

spark性能调优 | 内存优化

Spark性能调优第四季

Spark性能调优与故障处理之(3)Spark Shuffle 调优

spark性能调优

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)