Spark性能优化（7）——提高并行度

编程语言 2019-01-11 10:20:49 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/u012292754/article/details/86288373

1 提高并行度

spark-submit 配置了 2 个executor,每个 executor ,有5个 CPU core
new SparkConf().set("spark.default.parallelism","5"),表示所有 RDD 的 partition 都被设置为 5 个，也就是每个 RDD 的数据，都会被分成 5 份。那么针对 RDD 的 partition,一个 partition 会启动一个 task 来进行计算，所以对于所有的算子操作，都只创建 5 个 task 在集群运行
这个时候，集群中有 10 个 CPU core ，仅设置了 5 个 task ,相当于在集群中有 5个 cpu core 是空闲的。
最好的情况是每个 cpu core 都不空闲；
不一定设置 10 个 task,让每个 cpu core 一个 task, 可以设置 20 ~ 30 个 task。因为每个 task 执行的顺序和完成的时间可能是不一样的。如果正好就是 10 个 task，可能某个 task 很快完成了，那么那个 cpu 就又空闲了
Spark 官方推荐，设置集群总 cpu 数量的 2~3 倍的并行度，这样，每个 cpu core 可能分配到并发运行 2~3 个 task 线程

猜你喜欢

转载自blog.csdn.net/u012292754/article/details/86288373

Spark性能优化（7）——提高并行度

spark性能调优之提高并行度

spark性能调优---调节并行度

spark性能调优 | 默认并行度

Spark常规性能调优三：并行度调节

优化程序性能（3）——提高并行性

Spark并行度的设定

spark 并行度

Spark之性能优化重点——并行流数据接收

tomcat7 性能优化，提高并发

spark算子调优使用repartition解决Spark SQL降低并行度的性能问题

《性能优化》并发与并行

Spark项目实战-数据倾斜解决方案之提高shuffle操作reduce并行度

Spark（三十八）数据倾斜解决方案之提高shuffle操作reduce并行度

增加spark 并行度方式

spark并行度学习笔记

Spark 读取 Hbase 优化 --手动划分 region 提高并行数

大数据Spark优化读取Hbase--region 提高并行数过程详细解析

Spark系列（三）更快一点--Spark运行处理数据原理，如何简单提高并行度？？

Spark性能调优之合理分配系统资源以及并行度的调节

C++ 代码性能优化 -- 循环分割提高并行性

tomcat7 ，JVM性能优化，提高并发

Spark并行度优化增加cores,增加partition 还是增加instance

2.Apache Spark sql 一次80000并行度sql的优化经历

提高网页性能优化

30、提高并行度&广播共享数据

spark 大型项目实战(五十四):数据倾斜解决方案之提高shuffle操作reduce并行度

spark笔记-spark性能优化

spark--Spark性能优化

Spark实际项目中调节并行度

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)