Hadoop mapreduce过程key 和value分别存什么值 - 代码天地

Hadoop mapreduce过程key 和value分别存什么值

其他 2018-05-08 23:00:00 阅读次数: 1

转自：https://www.cnblogs.com/gaopeng527/p/5436820.html

这里以wordCount为例，直接看图就懂了：

（1）inputFormat将hdfs上要处理的文件一行一行的读入，将文件拆分成splits，由于测试用的文件较小，所以每个文件为一个split，并将文件按行分割形成<key,value>对，如图4-1所示。这一步由MapReduce框架自动完成，其中偏移量（即key值）包括了回车所占的字符数（Windows和Linux环境会不同）。

这里是把每个文件按行处理，下图有两个文件，每个文件有两行，每一行的开头字符所在位置的偏移量，第一行的开头偏移量自然是0,hello world共10个偏移量，加上中间的空格11个偏移量，回车再算一个，第二行的开头偏移量是12.

图4-1 分割过程

　　2）将分割好的<key,value>对交给用户定义的map方法进行处理，生成新的<key,value>对，如图4-2所示。

这里是用户自定义的map处理程序，每一行的字符按“ ” 分割，分割的每一个元素都记为1，也就是map节点的所有value都是1

图4-2 执行map方法

　　3）得到map方法输出的<key,value>对后，Mapper会将它们按照key值进行排序，并执行Combine过程，将key至相同value值累加，得到Mapper的最终输出结果。如图4-3所示。

图4-3 Map端排序及Combine过程

　　4）Reducer先对从Mapper接收的数据进行排序，再交由用户自定义的reduce方法进行处理，得到新的<key,value>对，并作为WordCount的输出结果，如图4-4所示。

图4-4 Reduce端排序及输出结果

猜你喜欢

转载自blog.csdn.net/csdnliuxin123524/article/details/80191199

Hadoop mapreduce过程key 和value分别存什么值

hadoop mapreduce 自定义key值注意事项

*****Hadoop的Mapreduce的shuffle过程！！

Hadoop（）MapReduce的shuffle过程

Hadoop执行MapReduce作业的过程-案例-计算pi的值

hadoop的mapReduce和Spark的shuffle过程的详解与对比及优化

什么是Hadoop的MapReduce？

hadoop MapReduce模型的shuffle过程

Hadoop(4)---mapreduce过程分析

Hadoop Mapreduce的shuffle过程详解

Hadoop MapReduce的类型和格式

spark和hadoop mapreduce的异同

Hadoop MapReduce和Yarn的关系

对字典分别按键（key）和值（value）进行排序

Python对字典分别按键（key）和值（value）进行排序

hadoop平台上HDFS和MAPREDUCE的功能、工作原理和工作过程

hadoop入门--图说MapReduce处理数据的过程

Hadoop MapReduce Job执行过程源码跟踪

Hadoop2.8.0<Mapreduce模型+shuffle过程>

Hadoop mapreduce执行过程涉及api

Hadoop之MapReduce过程，单词计数WordCount

HADOOP | MapReduce篇 (07) Shuffle 过程详解

Hadoop-MapReduce原理过程

Hadoop学习之Mapreduce执行过程详解

hadoop中mapreduce的shuffle过程详细解释

Hadoop-MapReduce执行的全过程

Hadoop mapreduce

hadoop的MapReduce

Hadoop - MapReduce

Hadoop（MapReduce）

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)