Hadoop入门（7）--MapReduce - 代码天地

Hadoop入门（7）--MapReduce

其他 2018-08-09 10:06:15 阅读次数: 0

MapReduce原理

分而治之，将一个大的任务拆分成很多小的子任务(map)，并行执行后，合并结果(reduce)。
这里写图片描述

MapReduce 运行流程

1 Job&Task
一个job会被拆分成多个Task
Task又分为

MapTask
ReduceTask

JobTracker的角色

作业调度
分配任务、监控任务执行进度
监控TaskTracker的状态

TaskTracker的角色

执行任务
汇报任务状态

Hadoop2.0以后的版本移除了原有的JobTracker和TaskTracker，改由Yarn平台的ResourceManager负责集群中的所有资源的同意管理和分配，NodeMangager管理Hadoop集群中单个计算节点
优点;

减少了JobTracker的资源小号，减少了1.0中发生单点故障的风险。
在YARN平台上还可以运行Spark和Storm作业，充分利用资源

MapReduce作业执行过程

这里写图片描述

MapReduce的容错机制

1 重复执行
最大重复执行4次，还是失败，则放弃执行
2推测执行
TaskTracker执行同一个任务时，其中有一个节点过慢
这里写图片描述
算的慢的继续算，再找一个TaskTracker算这个任务，谁先算完用那个，慢的停止

MapReduce的四个阶段

1 Splitf阶段：分片输入阶段

2 Map阶段(需要编码)

3 Shuffle阶段

Reduce阶段(需要编码)

实例

1 split阶段
file1 和 file2经过分片处理后生成Split123作为Map的输入
这里写图片描述
三行文本拆分成三份

2 Map阶段
输入为<key value>
value为单词出现的次数
这里写图片描述

3 Shuffle阶段
接收Map阶段的<key value>作为输入
Shuffle阶段可以理解为Map输出到Reduce输入的过程
设计网络传输
这里写图片描述
虽然有次数的累计，但是不会算出总数，只是将相同的放在一起

4 Reduce阶段
输入为<key value>
这里写图片描述

总结
这里写图片描述

猜你喜欢

转载自blog.csdn.net/weixin_39381833/article/details/81272527

Hadoop入门（7）--MapReduce

Hadoop-7-MapReduce

Hadoop MapReduce入门

Hadoop MapReduce 入门

Hadoop --- MapReduce 入门

Hadoop MapReduce 入门实例

7-MapReduce入门

hadoop入门--简单的MapReduce案例

hadoop-mapreduce-入门资料

Hadoop入门之HDFS与MapReduce

Hadoop+MapReduce 入门概述

Hadoop mapreduce 入门示例详解

hadoop入门1：MapReduce 入门demo - wordcont

7个实例全面掌握Hadoop MapReduce

Hadoop（7）：MapReduce计算模型介绍

hadoop入门--图说MapReduce处理数据的过程

Hadoop从入门到放弃系列------MapReduce

hadoop入门09：mapreduce开发总结

Apache Hadoop MapReduce WordCount案例编程入门

十五、Hadoop MapReduce之WordCount极速入门

入门Hadoop---MapReduce-API操作

【Hadoop离线基础总结】MapReduce入门

Hadoop入门之MapReduce实例二

Hadoop入门之MapReduce实例一

Hadoop 03——核心之MapReduce入门

hadoop详细笔记(九)-MapReduce入门程序

Hadoop mapreduce

Hadoop - MapReduce

hadoop的MapReduce

Hadoop（MapReduce）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)