map和mapPartition的区别 - 代码天地

map和mapPartition的区别

其他 2019-03-29 09:41:01 阅读次数: 0

主要区别：
map是对rdd中的每一个元素进行操作；
mapPartitions则是对rdd中的每个分区的迭代器进行操作
MapPartitions的优点：
如果是普通的map，比如一个partition中有1万条数据。ok，那么你的function要执行和计算1万次。使用MapPartitions操作之后，一个task仅仅会执行一次function，function一次接收所有的partition数据。只要执行一次就可以了，性能比较高。如果在map过程中需要频繁创建额外的对象(例如将rdd中的数据通过jdbc写入数据库,map需要为每个元素创建一个链接而mapPartition为每个partition创建一个链接),则mapPartitions效率比map高的多。SparkSql或DataFrame默认会对程序进行mapPartition的优化。
MapPartitions的缺点：
如果是普通的map操作，一次function的执行就处理一条数据；那么如果内存不够用的情况下，比如处理了1千条数据了，那么这个时候内存不够了，那么就可以将已经处理完的1千条数据从内存里面垃圾回收掉，或者用其他方法，腾出空间来吧。
所以说普通的map操作通常不会导致内存的OOM异常。但是MapPartitions操作，对于大量数据来说，比如甚至一个partition，100万数据，一次传入一个function以后，那么可能一下子内存不够，但是又没有办法去腾出内存空间来，可能就OOM，内存溢出。

猜你喜欢

转载自blog.csdn.net/weixin_43892898/article/details/88582378

map和mapPartition的区别

map()和mapPartition()的区别

SPARK之map()和mapPartition()的区别

Spark中MapPartition和Map的区别

Spark mapPartition方法与map方法的区别

mapPartition方法与map方法的区别(转载)

Spark_Spark中 map, mapPartition, flatMap, flatMapToPair 方法简介，区别与示例

(一)Spark常用算子：map，mapPartition，mapPartitionIndex，flatMap，filter

List 和 Map 区别

map和flatmap的区别

Map和WeakMap的区别

map 和 forEach 的区别

reduce和map的区别

forEach()和map()的区别

forEach和map的区别

filter和map的区别

map和flatmMap的区别

Map和Set的区别

map和forEach区别

forEach，for和map的区别

map和forEach的区别

Precision和mAP的区别

map和filter的区别

forEach() 和 map() 的区别

Object和Map的区别

set和map的区别

unordered_map 与 map 的区别和联系

STL map和unordered_map的区别

map和unordered_map的区别

set、List和Map的区别

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)