Spark调优--性能调优 - 代码天地

Spark调优--性能调优

其他 2018-11-25 17:12:34 阅读次数: 0

前天跟大家聊spark优化，说了个大体上的方案，今天就性能调优跟大家聊聊，首先分如下4块

一> 分配更多资源

分配哪些资源？

Executor的数量，每个executor所能分配的cpu数量，内存量，driver分配的内存量

在哪里分配呢？

在开发中，提交spark作业时，用的是spark-submit shell脚本，里面调整对应的参数

为什么得到这些资源以后，性能会得到提升？

I 如果需要对RDD进行cache，增加了内存，那么可以缓存更多的数据，将更少的数据写入磁盘，甚至不写入磁盘，减少了IO操作

II 对于shuffle操作，reduce端在拉去数据进行聚合的时候，入股内存不够，数据会写到磁盘，reduce就回去磁盘拉去，增加了IO操作，反之，内存相对大点，可以直接去内存拉，增加速度了

III 对于task的执行，可能会创建很多对象，如果内存比较小可能会频繁导致JVM堆内存满了，频繁垃圾回收，增大内存，速度会变快

一> 调节并行度

比如说有50个节点(executor),每个节点有3个core，那么集群开启可以一次跑150个task，如果不设置task数量，比如现在100个task开始跑的时候会白白浪费1/3的executor所以，要合理调节task跟core的数量

设置core跟Tast的数量官方是推荐，task数量，设置成spark application总cpu core数量的2~3倍，比如150个cpu core，基本要设置task数量为300~500。

一> RDD持久化

将数据持久化到内存，下次直接到内存取数据，更快

一> 广播变量

在我们提交作业的时候，需要传递到executor上的task去运行，对于一些固定的数据每次都需要Driver广播到task上，效率低，广播变量允许将变量广播到executor上的BlockManager，这样以后每个Task获取变量的时候可以直接在本地的BlockManager上获取变量了

猜你喜欢

转载自blog.csdn.net/qq_32736999/article/details/83959859

spark性能调优

Spark的性能调优

Spark 性能调优

Spark：性能调优

Spark调优之性能调优

Spark调优--性能调优

spark性能调优——开发调优

Spark Streaming：性能调优

Spark Streaming 性能调优

Spark的性能调优杂谈

Spark性能调优—高级

Spark性能调优总结

Spark SQL性能调优

Spark（七）————性能调优

spark sql 性能调优

Spark Streaming性能调优

Spark——性能调优——Shuffle

Spark 常规性能调优

Spark的性能调优(1)

Spark常规性能调优

Spark性能调优之常规性能调优（一）

Spark性能调优之数据倾斜调优

spark性能调优之开发调优

spark性能调优指南（四）（shuffle调优）

Spark性能调优之资源参数调优

Spark性能调优之 JVM调优（四）

Spark性能调优之 Shuffle调优（三）

Spark性能调优之算子调优（二）

Spark性能调优-Shuffle调优及故障排除篇

Spark Core（十九）Spark性能的调优

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)