闭包在spark中经常会看到,但理解也不难,按照闭包的构造可进行如下定义:
闭包首先有函数嵌套,内部函数引用外部函数的变量,然后返回一个函数
举个栗子:
object SparkDemo01 {
def main(args: Array[String]): Unit = {
println(makeAdd()(20))
}
def makeAdd() = {
val more = 10
(x:Int) => x + more
}
}
为啥要用函数嵌套?
需要外部函数的作用主要是隐藏变量,限制变量作用的范围。
有些人看到【闭包】这个名字,就一定觉得要用什么包起来才行。其实这只是翻译问题,闭包的原文是Closure,跟【包】没有任何关系
所以函数套函数只是为了造出一个局部变量,跟闭包无关。
为啥要return函数呢?
很明显,不return函数无法使用闭包
可将more变成makeAdd的参数,那么就是下面的形式:
def makeAdd(more : Int) = (x: Int) => x + more