（RDD）Broadcast 广播变量 - 代码天地

（RDD）Broadcast 广播变量

其他 2018-05-31 12:06:56 阅读次数: 0

1）假设某个作业有10000个tasks，每个task上有100M的变量，这个数据是很可怕的

所以：10000tasks ==>100 executor 广播变量是广播到executor上的，每个executor上的所有task共享

2）使用案例

map join 把小表的数据广播出去

BroadcastJoin = MapJoin

3）说明

Broadcast variables allow the programmer to keep a read-only variable cached on each machine rather than shipping a copy of it with tasks. They can be used, for example, to give every node a copy of a large input dataset in an efficient manner. Spark also attempts to distribute broadcast variables using efficient broadcast algorithms to reduce communication cost.

广播变量允许保留一个只读的变量，缓存在每台机器上，而不是每一个task上。相当于在每个executor都放一份，可以直接使用。Spark尝试去把广播变量分布到各个节点上去，降低通信成本

4）用法

scala> val broadcastVar = sc.broadcast(Array(1, 2, 3))
broadcastVar: org.apache.spark.broadcast.Broadcast[Array[Int]] = Broadcast(0)

scala> broadcastVar.value
res0: Array[Int] = Array(1, 2, 3)

猜你喜欢

转载自blog.csdn.net/qq_30130043/article/details/80316924

（RDD）Broadcast 广播变量

Flink Broadcast 广播变量

Broadcast广播变量

RDD广播变量

Flink中的Broadcast广播变量

Spark广播变量之broadcast

Spark RDD、广播变量简介

spark 广播（broadcast）变量和Accumulator

spark之广播共享变量broadcast

Flink DataSet API 之 Broadcast(广播变量)

Flink Broadcast 广播变量应用案例实战

RDD累加器和广播变量

广播 (Broadcast)

BroadCast(广播)

在使用Flink广播变量broadcast时遇到的坑

Spark之广播变量Broadcast Variables与计数器Accumulators

Spark中的累加器(accumlator)和广播变量(broadcast)

Spark调优(一)-----使用broadcast广播变量

Spark_RDD累加器和广播变量

Spark_RDD累加器和广播变量

【Spark】RDD 广播变量和累加器

broadcast广播机制的学习

android 广播broadcast

广播Broadcast简单使用

广播 broadcast 接收的方式

Broadcast发送广播

Broadcast Receiver广播基础

无线广播(Broadcast)【1】

Numpy 广播（Broadcast）

Android之 Broadcast广播

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)