Spark Yarn Cluster模式运行流程

以wordCount功能实现为例:
命令行:
bin/spark-submit
–class WordCount
–master yarn
–deploy-mode cluster
./WordCount.jar
./input ./output

Spark Yarn Cluster模式运行流程

命令行-脚本执行- SparkSubmit- 内部调用Client类里面的main方法并执行- 封装并发送指令bin/java ApplicationMaster-RM(ResourceManager)- 选择一台NM启动AM(ApplicationManager)- AM启动Driver线程 (执行代码-初始化SC-任务切分)- 申请资源-启动ExecutorBackend(bin/java CoarseGrainedExecutorBackend)- 在EB内部创建Executor对象- 接受Dirver分配的任务
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/gracejpw/article/details/105115486