Hadoop系列--Hadoop核心之MapReduce作业的生命周期

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_33429968/article/details/77119681

1 执行过程图解

2 步骤详解

2.1 作业提交与初始化

  可分为以下步骤:
  

  1. 用户提交作业
  2. JobClient实例将作业相关信息(比如程序jar包)上传到分布式文件系统(例如HDFS)
  3. JobClient通过RPC通知JobTracker
  4. JobTracker收到新作业提交请求后,由作业调度模块对作业进行初始化,为作业创建一个JobInProcess对象以跟踪作业运行情况

2.2 任务调度与监控

  可分为以下步骤:
  

2.3 任务运行环境准备

2.4 任务执行

猜你喜欢

转载自blog.csdn.net/qq_33429968/article/details/77119681