Spark2.3.1 函数传递 - 代码天地

Spark2.3.1 函数传递

其他 2018-07-10 16:13:31 阅读次数: 0

Spark API非常依赖于在驱动器程序传递函数到集群上运行，有两种方式

1 匿名函数

2 全局单例对象的静态方法

1) 传递单例对象的函数

object MyFunctions {
  def func1(s: String): String = { ... }
}

myRdd.map(MyFunctions.func1)

2) 在类的方法中有transformation/action操作，且闭包引用类变量，则实例化类对象并且调用该方法时会将整个实例对象传递给各个节点，这样会消耗带宽资源和存储空间，为避免这种情况，可以将类变量赋值给局部变量，让闭包引用局部变量，无需传递整个对象

class MyClass {
  def func1(s: String): String = { ... }
  def doStuff(rdd: RDD[String]): RDD[String] = { rdd.map(func1) }
}

class MyClass {
  val field = "Hello"
  def doStuff(rdd: RDD[String]): RDD[String] = { rdd.map(x => field + x) } //相当于this.field + x需要传递整个对象
}

def doStuff(rdd: RDD[String]): RDD[String] = {
  val field_ = this.field
  rdd.map(x => field_ + x)//赋值给局部变量，不需要传递整个对象
}

猜你喜欢

转载自blog.csdn.net/weixin_42129080/article/details/80959008

Spark2.3.1 函数传递

Spark2.3.1安装

Spark2.3.1 Shuffle Operations

Spark2.3.1 Quick Start

Spark2.3.1 RDD Programming Guide

Spark2.3.1 常用Transformations和Actions

spark2.3.1 安装过程

Windows10/Centos7安装Spark2.3.1

spark2.3.1读取hbase运行报错的解决办法

centos7 安装spark2.3.1 。安装scala2.12.6

CentOS7.5搭建Spark2.3.1分布式集群(HA)

Spark2.3.1版本全分布模式的安装与部署

spark2.3.1执行Spark SQL操作Parquet数据源错误解决（UnsatisfiedLinkError:uncompressedLength(Ljava/nio/ByteBuffer）

Spark编程中函数的传递

centos7 spark2.3.1集群搭建 centos7 安装hadoop2.7.6（分布式）

Spark——传递函数与闭包

Spark中RDD的函数传递——实现Serializable序列化

Spark Submit给jar包中的main函数传递参数

Spark的RDD函数传递、依赖关系、缓存及CheckPoint

Spark深入解析（十二）：RDD中的函数传递

Spark Core快速入门系列(5) | RDD 中函数的传递

Spark编程指南之二：向Spark算子传递函数

Spark之【RDD编程】详细讲解(No4)——《RDD中的函数传递》

使用docker搭建spark(2.3.1)集群

2.3.1

[Spark基础]--Spark-2.3.1发布说明

python的函数参数传递

JavaScript函数参数的传递

11.4 传递函数:

函数的参数传递

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)