Hadoop_17_MapRduce_MapTask并行度的决定机制 - 代码天地

Hadoop_17_MapRduce_MapTask并行度的决定机制

其他 2018-06-21 12:14:47 阅读次数: 3

　　MapTask的并行度决定map阶段的任务处理并发度，进而影响到整个job的处理速度那么，mapTask并行实例是否越多

越好呢？其并行度又是如何决定呢？Mapper数量由输入文件的数目、大小及配置参数决定；　

　　MapReduce将作业的整个运行过程分为两个阶段：Map阶段Reduce阶段。

　　Map阶段由一定数量的Map Task实例组成，例如：

输入数据格式解析：InputFormat
输入数据处理：Mapper
本地规约：Combiner（相当于local reducer，可选）
数据分组：Partitioner

　　Reduce阶段由一定数量的Reduce Task实例组成，例如：

数据远程拷贝
数据按照key排序
数据处理：Reducer
数据输出格式：OutputFormat

1.MapReduce的Map阶段：

1.1.从HDFS读取数据：

　 一个job的map阶段并行度由客户端在提交job时决定

　　而客户端对map阶段并行度的规划的基本逻辑为：将待处理数据执行逻辑切片（即按照一个特定切片大小，将待处理数据

划分成逻辑上的多个split），然后每一个split分配一个MapTask并行实例处理，即就是到底启动多少个MapTask实例就意味着将

数据切成多少份(一个切片对应一个MapTask实例)

　　切片逻辑及形成的切片规划描述文件，由 FileInputFormat 实现类的getSplits()方法完成：流程如下：

　　

　　

　　

　　

　　

　　

　　

　　

　　

猜你喜欢

转载自www.cnblogs.com/yaboya/p/9208259.html

Hadoop_17_MapRduce_MapTask并行度的决定机制

Hadoop中MapTask的并行度的决定机制

Hadoop数据切片与MapTask并行度决定机制

切片与MapTask并行度决定机制

切片与MapTask并行决定机制

MapReduce并行度决定机制

maptask的并行度

B05 - 050、MapTask并行度机制

3.1.2 HADOOP框架（MapReduce编程框架，序列化Writeable接口，Maptask并行度，ReduceTadk并行度，shuffle机制，排序，join,自定义读取、输出）

Hadoop-MapReduc入门（代码编写流程，运行流程，并行度决定机制）

maptask和reduceta的并行度

Hadoop中maptask数量的决定因素

Hadoop_18_MapRduce的shuffle机制

【大数据】MapTask并行度和切片机制

MapReduce切片机制以及maptask和reducetask并行度设置

hadoop maptask

Hadoop | MapReduce的并行度

MapReduce并行度机制

Hadoop之 MapReduce （MapTask 和 ReduceTask 工作机制详解）

Hadoop MapTask / ReducerTask

关于hadoop的maptask数量

MapTask工作机制

MapTask运行机制

MapReduce的MapTask执行机制

关于Hadoop读文件的并行度

Hadoop-MapReduce-详细解析MapTask和ReduceTask工作机制-连载中

Hadoop之MapReduce的MapTask详解

【大数据】MapTask工作机制

MapTask工作机制图解

Hadoop_15_MapRduce 示例编写及编程规范

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)