HadoopMapReduce运行机制

其他 2018-11-23 23:37:55 阅读次数: 0

1.map方法读取一个文件的一行记录进行分析, 输入:LongWritable(当前读取的文件位置), Text(内容)

2.map将读取到的信息进行分类,输入Context (键值对) ;作为Reduce 的输入数据

3.当所有的map运行完后,mapreduce 框架会通过一个Patitioner 类进行reduce输入数据的分发.

默认的分发规则为:通过比较两个key的hashCode值与reduce个数取摩,

/** Use {@link Object#hashCode()} to partition. */
public int getPartition(K2 key, V2 value,
int numReduceTasks) {
return (key.hashCode() & Integer.MAX_VALUE) % numReduceTasks;
}

返回的摩就是目标reduce task

猜你喜欢

转载自www.cnblogs.com/liuyongpingblog/p/10010168.html

HadoopMapReduce运行机制

Handler运行机制

JavaScript运行机制

JVM运行机制

spring运行机制

dubbo 运行机制

HDFS 的运行机制

DNS的运行机制

mapreduce运行机制

Android 的运行机制

JSP运行机制

SpringMvc运行机制

nodejs运行机制

YARN的运行机制

JS运行机制

运行机制

代码运行机制

session是运行机制

JavaScript 运行机制

C运行机制

YARN运行机制

session运行机制

scrapy运行机制

java的运行机制

HDFS的运行机制

python的运行机制

Hbase运行机制

MapTask运行机制

RabbitMQ运行机制

javascript的运行机制

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)