【hadoop】细读MapReduce的工作原理 - 代码天地

【hadoop】细读MapReduce的工作原理

其他 2019-09-16 07:53:59 阅读次数: 0

前言：中秋节有事外加休息了一天，今天晚上重新拾起Hadoop，但感觉自己有点烦躁，不知后续怎么选择学习Hadoop的方法。

干脆打开电脑，决定：

1、先将Hadoop的MapReduce和Yarn基本原理打扎实了再说，网上说的边画图边记得效果好点；

2、有时间就多看看Java和Python的基础知识，牢固牢固；

3、开始学习hive以及spark

正文：

MapReduce如何分而治之？

Map阶段：

a.拆分输入数据（Split）：逐行读取数据，得到一系列（key/value）

注：Split个数根据文件多少来分配，key值包括回车符

b.执行用户自定义的Map方法

c.Mapper按输出的key值对输出的（key，value）进行排序，并执行combine过程，将key值相同的value累加

注1：combine不能取代reduce，但combine可以减少map和reduce之间数据传输量

注2：在map和cobine之间还有两个过程：collect和spill

collect：是map方法处理完数据后，一般调用OutputCollector。collect()收集结果，并在该内部形成（key/value）分片，并写入一个环形缓冲区

spill：当环形缓冲区填满后，MapReduce会将数据写入本地磁盘，生成临时文件

Reduce阶段：

对Map阶段输出的值进行自定义的reduce函数处理，并输出新的（key/value），并作为结果输出。

Reduce阶段分5个步骤：shuffle（复制）——merge（合并）——sort（排序）——reduce（执行函数）——write（写入结果）

猜你喜欢

转载自www.cnblogs.com/CQ-LQJ/p/11525286.html

【hadoop】细读MapReduce的工作原理

Hadoop的MapReduce的工作原理

Hadoop之MapReduce工作原理

Hadoop-MapReduce的工作原理

Hadoop_MapReduce工作原理

MapReduce工作原理--Hadoop2.6

Hadoop2.6 ---- MapReduce工作原理

Hadoop_MapReduce_Shuffle工作原理

hadoop学习笔记（十）：MapReduce工作原理（重点）

Hadoop2.6（新版本）----MapReduce工作原理

Hadoop基础-MapReduce的工作原理第二弹

Hadoop 之 MapReduce 的工作原理及其倒排索引的建立

Hadoop MapReduce工作机制

Hadoop MapReduce 的工作机制

【Hadoop】：MapReduce的工作机制

Hadoop Mapreduce 工作机制

hadoop (mapreduce运行原理)

hadoop基础-MapReduce原理

hadoop mapreduce 原理

Hadoop 之 MapReduce原理

Hadoop MapReduce原理及实例

Hadoop Mapreduce原理

Hadoop | MapReduce 原理分析

Hadoop：MapReduce框架原理

【Hadoop】MapReduce 原理

MapReduce工作原理

MapReduce工作原理简介

MapReduce的工作原理-笔记

MapReduce工作原理详解

MapReduce的基本工作原理

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)