版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/weixin_40042143/article/details/83932052
what is Apache Spark?
Apache Spark是一个开源的、功能强大的分布式查询和处理引擎。
Spark Jobs and APIs
执行过程:Execution process
对于spark应用,它的驱动进程在master结点上,执行进程分布在worker结点上。
spark job 可以看作式一有向无环图过程