spark的共享变量--累加器 - 代码天地

spark的共享变量--累加器

编程语言 2018-07-21 02:58:56 阅读次数: 0

累加器(共享变量):accumulator

注意:

首先要创建累加器的对象初始值是0
驱动器(driver program)程序可以调用累加器的value属性
累加器是一个只写变量
累加器最好还是不要在transform操作中使用：原因

（在transform操作中spark有可能会重复进行计算，例如如果有一个节点崩溃了，spark会自动将任务运行在另外一个节点上，这就造成了累加器有可能会被重复用到，因此好的办法是将累加器放在Action操作中的foreach里面）

例子1:

val conf = new SparkConf().setAppName("累加器").setMaster("local[2]")
val sc = new SparkContext(conf)
val blankLines = sc.accumulator(0) //创建累加器，初始值是0
val file = sc.textFile("C:\\Users\\MK\\Desktop\\tmp\\a.txt")
val result = file.flatMap(line => {
  if (line == "") {
    blankLines += 1 //累加器是一个只写变量
  }
  line.split(" ")
})
println(result.collect().mkString(","),blankLines.value)

原始数据:
1
3

s
a

ew
ui

asd

输出数据:(1,3,,s,a,,ew,ui,,asd,3)

例子2:

val accum = sc.accumulator(0)
 sc.parallelize(Array(1, 2, 3, 4)).foreach(x => accum += x)
accum.value
输出是:10

猜你喜欢

转载自blog.csdn.net/qq_33982605/article/details/81111244

spark的共享变量--累加器

Spark：共享变量(广播变量和累加器)

spark共享变量：累加器与广播变量

Spark共享变量---累加器（及transformation和action回顾）

Spark 共享变量之——Accumulator（累加器）

大数据：spark共享广播变量，累加器

Spark十累加器与广播变量

Spark:广播变量和累加器

Spark中的广播变量与累加器

Spark广播变量和累加器

Spark - 广播变量 & 累加器

Spark的累加器和广播变量

(五)Spark广播变量，累加器

【Spark】广播变量和累加器

Spark入门（六）：共享变量（累加器和广播变量）

大数据开发-Spark-共享变量之累加器和广播变量

spark 累加器

Spark累加器

spark记录（2）spark广播变量与累加器

大数据Spark06_广播变量、累加器

spark的广播变量和累加器的用法

Spark：广播变量和累加器的使用

spark中的累加器和广播变量

spark学习记录（八、广播变量和累加器）

SparkCore 累加器和广播变量(Spark编程进阶)

Spark Streaming 解析-累加器和广播变量

Spark中的累加器(accumlator)和广播变量(broadcast)

Spark中广播变量和累加器

Spark 系列（六）—— 累加器与广播变量

Spark_RDD累加器和广播变量

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)