MapReduce工作流程和原理 - 代码天地

MapReduce工作流程和原理

其他 2019-03-10 16:10:54 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_33054265/article/details/87385268

MapReduce的详细工作流程图如下：
MapReduce工作流程1
MapReduce工作流程2
MapReduce的主要工作原理：

MapTask收集map()方法输出的kv对，放到内存缓冲区中。
从内存缓冲区不断溢出到本地磁盘文件，可能会溢出多个文件。
多个溢出文件会被合并成大的溢出文件。
在溢出过程以及合并过程中，都要调用Partitioner进行分区，以及针对key进行排序。
ReduceTask根据自己的分区号，去各个MapTask机器上取相应结果的分区数据。
ReduceTask会取到同一个分区的来自不同MapTask的结果文件，ReduceTask会将这些文件再进行合并（归并排序）。
合并成大文件后，Shufle过程（Map方法之后Reduce方法之前的过程，图中第7步到第16步）也就结束了，后面进入ReduceTask的逻辑运算过程（从文件中取出一个一个的键值对，调用用户自定义的reduce()方法）。

猜你喜欢

转载自blog.csdn.net/qq_33054265/article/details/87385268

MapReduce工作流程和工作原理

MapReduce工作流程和原理

Yarn工作原理及MapReduce工作流程

MapReduce 原理之工作流程

MapReduce工作流程

MapReduce框架原理之（二）MapReduce工作流程

MapReduce框架原理之MapReduce工作流程

Hadoop 之 MapReduce （InputFormat 和 MapReduce工作流程）

三-中下, 大数据基础架构Hadoop- MapReduce框架原理和工作流程剖析

mapreduce on yarn的工作流程

Mapreduce工作流程总结

MapReduce工作流程分析

Mapreduce基本工作流程

MapReduce简述、工作流程

BBR的工作流程和原理

netty工作流程和原理

Appium框架原理和工作流程

struts2的工作原理和工作流程

十二、MapReduce详细工作流程

mapreduce job在yarn上的工作流程

MapReduce工作流程超详细解释

4 MapReduce 工作流程详解

MapReduce的详细工作流程

Yarn及MapReduce工作流程（总结版）

干货丨MapReduce的工作流程是怎样的？

图文详解 MapReduce 工作流程

Hibernate原理及工作流程

spark工作流程及原理

SpringMVC工作流程原理

Mybatis 的工作流程及原理

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)