Spark中的累加器(accumlator)和广播变量(broadcast) - 代码天地

Spark中的累加器(accumlator)和广播变量(broadcast)

其他 2019-01-23 14:50:34 阅读次数: 0

共享变量：累加器(accumlator)和广播变量(broadcast)

累加器：用来对信息进行聚合
广播变量：用来高效分发较大的对象

累加器(accumlator)

只有在运行行动操作（比如count）后才能看到正确的计数，因为行动操作前的转化操作（比如map）是惰性的，所以累加器只有在惰性的转化操作被行动操作强制出发时才会开始求值。
累加器的值只有在驱动程序中访问，工作节点上的任务不能访问累加器的值。
对于要在行动操作中使用的累加器，Spark只会把每个任务对各自累加器的修改应用一次。因此，如果想要一个无论在失败还是重复计算时都绝对可靠的累加器，必须把它放在foreach()这样的行动操作中。

在这里插入图片描述

广播变量(broadcast)

通过对一个类型T的对象调用SparkContext.broadcast创建出一个Broadcast[T]对象。
任何可序列化的类型都可以这么实现
通过value属性访问该对象的值（JAVA中为value()方法）
变量只会被发到各个节点一次，应作为只读值处理（修改这个值不会影响到别的节点）
广播一个比较大的值时，就的选择既快又好的序列化格式是很重要的，如果序列化对象的时间很长或者传送话费的时间太久，这段时间很容易就成为性能的瓶颈。

在这里插入图片描述

不使用广播变量的时候，genderMap会打包进每个task中去。
使用广播变量后，genderMap会发送到每个节点上的Excutor上去，该Excutor下面的task就可以共享这个变量了，一定程度上提升了性能。

猜你喜欢

转载自blog.csdn.net/xcf111/article/details/86496864

Spark中的累加器(accumlator)和广播变量(broadcast)

Spark中的广播变量与累加器

Spark:广播变量和累加器

Spark广播变量和累加器

Spark的累加器和广播变量

【Spark】广播变量和累加器

spark中的累加器和广播变量

spark scala broadcast variable广播变量和Accumulator累加器

spark复习二：Broadcast广播变量和accumulator累加器

Spark2.3（四十三）：Spark Broadcast总结【Spark篇】---Spark中广播变量和累加器

Spark：共享变量(广播变量和累加器)

spark的广播变量和累加器的用法

Spark：广播变量和累加器的使用

SparkCore 累加器和广播变量(Spark编程进阶)

spark学习记录（八、广播变量和累加器）

Spark Streaming 解析-累加器和广播变量

Spark中广播变量和累加器

Spark_RDD累加器和广播变量

Spark_RDD累加器和广播变量

spark广播变量，累加器和SparkShuffle

【Spark】RDD 广播变量和累加器

Spark十累加器与广播变量

Spark - 广播变量 & 累加器

(五)Spark广播变量，累加器

广播变量和累加器

RDD累加器和广播变量

spark记录（2）spark广播变量与累加器

spark共享变量：累加器与广播变量

广播变量与累加器

Spark笔记整理（五）：Spark RDD持久化、广播变量和累加器

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)