MapReduce的运行流程

一 基本概念
1、job & Task
2、jobTracker
3、TaskTracker
 
二 Hadoop MapReduce体系结构


 
 
三 JobTracker的角色
1、作业调度
2、分配任务、监控任务执行进度
3、监控TaskTrack的状态
 
四 TaskTracker的角色
1、执行任务
2、汇报任务状态
 
五 MapReduce作业执行流程

六 MapReduce容错机制
1、重复执行,默认4次。
2、推测执行,如果一个非常慢,再启动一个TaskTracker,谁先算完,就把另外一个终止。


 

猜你喜欢

转载自cakin24.iteye.com/blog/2396890