RecordReader and InputFormat vs OutputFormat and RecordWriter - 代码天地

RecordReader and InputFormat vs OutputFormat and RecordWriter

其他 2019-06-14 02:07:55 阅读次数: 0

RecordReader and InputFormat vs OutputFormat and RecordWriter

Thanks Yahoo!

InputFormat从HDFS中读取文件，InputFormat abstract类中有一个方法是getSplits，会返回这么文件要分成几个InputSplit。一般来说一个InputSplit会对应的一个Map task上去。
每个Map task会通过RecordReader来读取InputSplit中的内容，将它们组成成key value的pair，传递给map方法。
然后通过combine和partitioner，将数据缓存（如果数据比较大），等待Reduce task来拿自己的数据。
Reduce task拿到数据后，通过归类和排序后，将结果传递给reduce方法
reduce方法处理完成后，会将自己的结果写入OutputFormat中
在OutputFormat中，有一个getRecordWriter方法，RecordWrite会讲reduce传入的key value pair写入文件
到这里，一个map-reduce 过程结束

https://www.slideshare.net/martyhall/hadoop-tutorial-mapreduce-part-4-input-and-output

猜你喜欢

转载自blog.csdn.net/lantianjialiang/article/details/82797108

RecordReader and InputFormat vs OutputFormat and RecordWriter

Hadoop的OutputFormat和InputFormat

MapReduce自定义InputFormat,RecordReader

Hadoop常用的OutputFormat和InputFormat

十四、MapReduce--OutputFormat和RecordWriter抽象类

Hadoop开发常用的InputFormat和OutputFormat

hadoop 自定义inputformat和outputformat

Hadoop开发常用的InputFormat和OutputFormat(转)

修改 Hive Metastore 里记录的 InputFormat、OutputFormat

自定义InputFormat和OutputFormat案例

InputFormat及RecordReader分析及自定义实现子类

十、MapReduce--InputFormat以及RecordReader抽象类

Hadoop MR 之(四) InputFormat 类 / OutputFormat类

InputFormat牛逼（4）org.apache.hadoop.mapreduce.RecordReader<KEYIN, VALUEIN>

outputFormat

【Hadoop离线基础总结】MapReduce自定义InputFormat和OutputFormat案例

InputFormat

【大数据day15】——自定义InputFormat合并小文件，自定义outputFormat订单评论分组，自定义分组求取topN

Hadoop_MapReduce实践 (二) =＞ (核心架构、序列化、Inputformat/切片、Shuffile/分区/排序、outputformat、join、ETL、压缩)

hadoop的outputformat

InputFormat解读

hadoop inputformat

InputFormat的作用

Hadoop 源码详解之RecordReader接口

自定义OutputFormat

探索Hadoop OutputFormat

Hadoop OutputFormat浅析

Hadoop之OutputFormat

OutputFormat数据输出

Hadoop基础【3】 OutputFormat

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

事务隔离级及脏读、幻读和不可重复读

rtos：zephyr同步信号量

把对象转换为JSON格式的数据

iOS Dev (56) iTunes Store 销售日报更新时间

Failed to start mongod.service: Unit not found;mongodb in unbuntu

Upgrading PHP on CentOS 6.5 (Final)

（四）王道机试指南___排版问题

TensorFlow之手写体识别

xcode xib报错 Safe Area Layout Guide Before IOS 9.0

【LeetCode】76. Minimum Window Substring（C++）

每日归档

更多

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)