MapReduce过程 - 代码天地

MapReduce过程

其他 2018-05-19 01:46:09 阅读次数: 2

map端5步走：

1.1 读取要操作的文件–这步会将文件的内容格式化成键值对的形式，键为每一行的起始位置偏移，值为每一行的内容。
1.2 调用map进行处理–在这步使用自定义的Mapper类来实现自己的逻辑，输入的数据为1.1格式化的键值对，输入的数据也是键值对的形式。
1.3 对map的处理结果进行分区–map处理完毕之后可以根据自己的业务需求来对键值对进行分区处理，比如，将类型不同的结果保存在不同的文件中等。这里设置几个分区，后面就会有对应的几个Reducer来处理相应分区中的内容。
1.4 分区之后，对每个分区的数据进行排序，分组–排序按照从小到大进行排列，排序完毕之后，会将键值对中，key相同的选项的value进行合并。如，所有的键值对中，可能存在
hello 1
hello 1
key都是hello，进行合并之后变成
hello 2
可以根据自己的业务需求对排序和合并的处理进行干涉和实现。
1.5 归约（combiner）–简单的说就是在map端进行一次reduce处理，但是和真正的reduce处理不同之处在于：combiner只能处理本地数据，不能跨网络处理。通过map端的combiner处理可以减少输出的数据，因为数据都是通过网络传输的，其目的是为了减轻网络传输的压力和后边reduce的工作量。并不能取代reduce。

map端有“reduce”过程，可以减少网络的占用。

reduce端3步走：

2.1 通过网络将数据copy到各个reduce。
2.2 调用reduce进行处理–reduce接收的数据是整个map端处理完毕之后的键值对，输出的也是键值对的集合，是最终的结果。
2.3 将结果输出到hdfs文件系统的路径中。

猜你喜欢

转载自blog.csdn.net/data8866/article/details/80315033

MapReduce过程

MapReduce 过程

MapReduce中shuffle过程

MapReduce:详解Shuffle过程

MapReduce执行过程

MapReduce 过程分析

MapReduce具体过程

MapReduce的shuffle过程

MapReduce过程分析

MapReduce过程详解

MapReduce的Shuffle过程详解

MapReduce 的shuffle过程

MapReduce过程详解（转）

MapReduce模型过程详解

MapReduce的原理及执行过程

*****Hadoop的Mapreduce的shuffle过程！！

MapReduce的整个详细过程

MapReduce shuffle的过程分析

MapReduce shuffle过程原理

MapReduce的详细过程

MapReduce shuffle过程详解

Hadoop（）MapReduce的shuffle过程

MapReduce详解Shuffle过程

MapReduce的Shuffle 过程

mapreduce的shufflue过程

MapReduce过程源码分析

详解MapReduce过程

简述Mapreduce的Shuffle过程

mapreduce 的shullfe过程

MapReduce的原理及执行过程 MapReduce简介

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)