spark之JVM调优二：调节Executor堆外内存 - 代码天地

spark之JVM调优二：调节Executor堆外内存

其他 2019-06-19 08:59:31 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/m0_37294838/article/details/91410637

Executor的堆外内存主要用于程序的共享库、Perm Space、线程Stack和一些Memory mapping等, 或者类C方式allocate object。

有时，如果你的Spark作业处理的数据量非常大，达到几亿的数据量，此时运行Spark作业会时不时地报错，例如shuffle output file cannot find，executor lost，task lost，out of memory等，这可能是Executor的堆外内存不太够用，导致Executor在运行的过程中内存溢出。

stage的task在运行的时候，可能要从一些Executor中去拉取shuffle map output文件，但是Executor可能已经由于内存溢出挂掉了，其关联的BlockManager也没有了，这就可能会报出shuffle output file cannot find，executor lost，task lost，out of memory等错误，此时，就可以考虑调节一下Executor的堆外内存，也就可以避免报错，与此同时，堆外内存调节的比较大的时候，对于性能来讲，也会带来一定的提升。

默认情况下，Executor堆外内存上限大概为300多MB，在实际的生产环境下，对海量数据进行处理的时候，这里都会出现问题，导致Spark作业反复崩溃，无法运行，此时就会去调节这个参数，到至少1G，甚至于2G、4G。

Executor堆外内存的配置需要在spark-submit脚本里配置，如代码清单所示：

Executor堆外内存配置

--conf spark.yarn.executor.memoryOverhead=2048

以上参数配置完成后，会避免掉某些JVM OOM的异常问题，同时，可以提升整体Spark作业的性能。

猜你喜欢

转载自blog.csdn.net/m0_37294838/article/details/91410637

spark之JVM调优二：调节Executor堆外内存

Spark（十九）JVM调优之调节executor堆外内存与连接等待时长

Spark调优：调节Executor的堆外内存

spark 大型项目实战(三十四): --JVM调优之调节executor堆外内存与连接等待时长

JVM调优之调节executor堆外内存与连接等待时长

Spark部分的调优（代码调优，内存优化，调节Executor的堆外内存，shuffle调优，解决数据倾斜，Spark故障解决）【原理及方法介绍】

spark-调节executor堆外内存

Spark 从 0 到 1 学习(10) —— Spark 调优(四)——Executor 的堆外内存调优

调节executor堆外内存与连接等待时长

JVM - 堆内存调优

Spark调优之JVM调优

Spark Shuffle调优之调节map端内存缓冲与reduce端内存占比

JVM--堆内存调优

完整的JVM堆外内存泄漏故障排查记录，看完别再说没JVM调优经验

调优实例 - 堆外内存导致的溢出错误

JVM学习笔记三：JVM堆内存调优（初步）

【JVM】Java虚拟机JVM堆内存调优

Spark 堆外内存

JVM堆外内存

【jvm】堆外内存

spark调优（二）------合理调节作业中的并行度

spark 大型项目实战(三十六):Shuffle调优之调节map端内存缓冲与reduce端内存占比

Spark(二十二）Shuffle调优之调节Map端内存缓冲与Reduce端内存占比

Spark性能调优之 JVM调优（四）

spark的jvm调优

jvm 调优《三》堆栈内存结构

jvm详解、GC、堆内存参数调优

JVM 堆体系结构及其内存调优

JVM 堆体系结构及其内存调优

Spark内存调优

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)