Hadoop（）MapReduce基本原理 - 代码天地

Hadoop（）MapReduce基本原理

其他 2019-02-17 16:00:53 阅读次数: 0

版权声明：@GaoShan https://blog.csdn.net/weixin_42969976/article/details/87534630

什么是MapReduce

MapReduce是一种可用于数据处理的并行运算框架。基于该框架能够容易地编写应用程序，这些应用程序能够运行在由上千个商用机器组成的大集群上，并以一种可靠的，具有容错能力的方式并行地处理上TB级别的海量数据集。

MR启动过程

client客户端向yarn集群(resourcemanager)提交任务
resourcemanager选择一个node创建appmaster
appmaster根据任务向rm(resourcemanager)申请资源
rm返回资源申请的结果
appmaster去对应的node上创建任务需要的资源（container形式，包括内存和CPU）
appmaster负责与nodemanager进行沟通，监控任务运行
最后任务运行成功，汇总结果

MapReduce中的Combiner

①是为了避免MapTask和ReduceTask之间的数据传输而设置的。
②Hadoop允许针对Map Task的输出指定一个合并函数。
③Combiner为了减少传输到Reduce阶段的数据量
减少了Mapper阶段的输出，从而减少网络带宽和Reduce阶段的负载

猜你喜欢

转载自blog.csdn.net/weixin_42969976/article/details/87534630

Hadoop的MapReduce模型基本原理

Hadoop（）MapReduce基本原理

MapReduce—基本原理

Hadoop-MapReduce基本原理及相关操作

Hadoop框架：MapReduce基本原理和入门案例

学习笔记：MapReduce基本原理

一、MapReduce基本原理

MapReduce基本原理（详解！）

Hadoop之Yarn的基本原理

Hadoop（4）：HDFS 基本原理

×××基本原理

基本原理

Hadoop2.x基本原理与架构

Hadoop介绍-1.基本原理

node 基本原理

solr的基本原理

jvm 基本原理

爬虫基本原理

Hive基本原理

hibernate基本原理

Bitcoin 的基本原理

WebService基本原理

hashMap 基本原理

ehcache 基本原理

ehcache基本原理

SVPWM基本原理

QoS的基本原理

PID基本原理

OFDM的基本原理

ZooKeeper基本原理

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)