MappReduce工作流程 - 代码天地

MappReduce工作流程

其他 2018-11-10 15:27:40 阅读次数: 0

版权声明：有一种生活不去经历不知其中艰辛,有一种艰辛不去体会,不会知道其中快乐,有一种快乐,没有拥有不知其中纯粹 https://blog.csdn.net/wwwzydcom/article/details/83833118

Map阶段

在这里插入图片描述
1.待处理文本
2.客户端submit()前获取待处理数据信息,然后根据参数设置,形成一个任务分配的规划,切片信息
3.提交切片信息
job.split
wc.jar
job.xml
4.yarn RM 计算出maptask的数量 Mr appmaster nodemastask数量
拿到的是切片信息,多少个切片,就有多少个maptask
5.默认TextInputFormat
maptask 发出inputFormat —> RecordReader (流的拷贝)
返回 K-V对
6. Mapper逻辑运算 map(K,V) context.write(k,v) ----> outputCollector
7. 向环形缓冲区写入<K,V>数据
在这里插入图片描述
一端是元数据索引(key-value-reduceTypenum:大小,长度,格式),一端是数据,默认是100M,达到80%反向,溢写数据
8.分区,实际是对索引的分区,分区内容的排序,对key进行排序,默认是字典排序,字典排序过程中是使用的快速排序
9.溢写文件(分区且区内有序) 环形再往回写循环
很多次溢写,只要达到80%,
10.合并merge 归并排序
在这里插入图片描述
多次溢写

Reduce阶段

在这里插入图片描述
1.所有map结束

maptask不能小于分区数

拷贝自己处理分区的数据
先放到内存中,进行归并排序
优化重点:拷贝过来内存不够,写进磁盘,自己优化内存

猜你喜欢

转载自blog.csdn.net/wwwzydcom/article/details/83833118

MappReduce工作流程

git工作流程

Spring工作流程

MINA工作流程

springMVC工作流程

Git 工作流程

SpringMVC的工作流程

Struts 工作流程

HDFS的工作流程

Nutch的工作流程

Spring 工作流程

Redux的工作流程

Struts的工作流程

CAS工作流程

工作流程

HTTP工作流程

Hystrix工作流程

MyBatis工作流程

https 工作流程

SpringMVC 工作流程

redux工作流程

Docker的工作流程

Maven工作流程

SpingMVC的工作流程

scrapy工作流程

gitlab的工作流程

github工作流程

Mybatis的工作流程

struts工作流程

Hibernate工作流程

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)