【Hadoop学习之MapReduce】_14MR的核心思想

一、MapReduce核心思想

在这里插入图片描述

  1. 分布式的运算程序往往需要分成至少2个阶段
  2. 第一个阶段的MapTask并发实例,完全并行运行,互不相干
  3. 第二个阶段的ReduceTask并发实例互不相干,但是他们的数据依赖于上一个阶段的所有MapTask并发实例的输出
  4. MapReduce编程模型只能包含一个Map阶段和一个Reduce阶段,如果用户的业务逻辑非常复杂,那就只能多个MapReduce程序,串行运行

二、MapReduce的进程

一个完整的MapReduce程序在分布式运行时有三类实例进程:

  1. MrAppMaster:负责整个程序的过程调度及状态协调
  2. MapTask:负责Map阶段的整个数据处理流程
  3. ReduceTask:负责Reduce阶段的整个数据处理流程
发布了30 篇原创文章 · 获赞 30 · 访问量 769

猜你喜欢

转载自blog.csdn.net/qq_40947493/article/details/104196498