learning pyspark:chapter1.understanding spark

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/weixin_40042143/article/details/83932052

what is Apache Spark?

Apache Spark是一个开源的、功能强大的分布式查询和处理引擎。

Spark Jobs and APIs

执行过程:Execution process

对于spark应用,它的驱动进程在master结点上,执行进程分布在worker结点上。

spark job 可以看作式一有向无环图过程

 

猜你喜欢

转载自blog.csdn.net/weixin_40042143/article/details/83932052