【SPARK】- RDD分区 - 代码天地

【SPARK】- RDD分区

其他 2018-10-11 16:10:47 阅读次数: 0

RDD是弹性分布式数据集，通常RDD很大，会被分成很多分区，分别保存在不同节点上

分区原则

RDD分区是使分区的个数尽量等于集群中的CPU核心数目

默认分区数

对于不同的Spark部署模式而言（本地模式、Standalone模式、YARN模式、Mesos模式），都可以通过设置spark.default.parallelism这个参数的值来配置默认分区数。

本地模式：默认为本地机器的CPU数目，若设置了local[N]，则默认为N

Mesos：默认分区数为8

Standalone/YARN：在“集群中所有CPU核心数目总和”和“2”二者中较大值作为默认值

如何手动设置分区

（1）创建RDD时：在调用textFile和parallelize方法时候手动指定分区个数，sc.textFile(path,partionNum)

对于parallelize而言，如果没有在方法中指定分区数，则默认为spark.default.parallelism

对于textFile而言，如果没有在方法中指定分区，则默认为min(defaultParallelism,2)，其中defaultParallelism对应的就是spark.default.parallelism

（2）通过转换操作得到新RDD时：直接调用reparation方法

扫描二维码关注公众号，回复： 3532352 查看本文章

如果是从HDFS中读取文件，则分区数为文件分片数（比如，128MB/片）

猜你喜欢

转载自blog.csdn.net/u010530712/article/details/82655676

spark Rdd的默认分区

【SPARK】- RDD分区

【spark】RDD分区解析

【Spark】RDD分区

Spark的RDD分区器

Spark RDD分区

Spark RDD的默认分区数

spark rdd分区与任务的关系

Spark中的RDD以及分区

Spark——键值对 RDD 数据分区

【Spark练习】RDD分区操作

Spark RDD的默认分区数：（spark 2.1.0）

[Spark RDD_add_2] Spark RDD 分区补充内容

Spark2.0-RDD分区原理分析

影响Spark输出RDD分区的操作函数

查看spark RDD 各分区内容

Spark中键值对RDD数据分区

Spark创建RDD分区数量源码详解

Spark RDD算子之RDD 分区操作 -- mapPartitions、mapPartitionsWithIndex、glom

Spark算子：统计RDD分区中的元素及数量

spark-获取RDD的方式以及从分区中获益的操作

Spark算子：RDD分区中的元素和数量统计

Spark从文件中创建RDD的分区机制源码解析

Spark 创建RDD、DataFrame各种情况的默认分区数

Spark 学习（四）RDD自定义分区和缓存

Spark内存RDD分区切片源码详解

Spark修改RDD分区数的五种方式

spark 中如何查看单个RDD分区的内容（创建分区，查看分区数）

Update：spark_rdd算子：第2节 RDD_action算子_分区_缓存

Spark学习---2、SparkCore（RDD概述、RDD编程（创建、分区规则、转换算子、Action算子））

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)