Map/Reduce中的Combiner的使用 - 代码天地

Map/Reduce中的Combiner的使用

企业开发 2018-05-31 15:29:16 阅读次数: 0

一、作用

1、combiner最基本是实现本地key的聚合，对map输出的key排序，value进行迭代。如下所示：

map: (K1, V1) → list(K2, V2)
combine: (K2, list(V2)) → list(K2, V2)
reduce: (K2, list(V2)) → list(K3, V3)

2、combiner还具有类似本地的reduce功能.

例如hadoop自带的wordcount的例子和找出value的最大值的程序，combiner和reduce完全一致。如下所示：
map: (K1, V1) → list(K2, V2)
combine: (K2, list(V2)) → list(K3, V3)
reduce: (K3, list(V3)) → list(K4, V4)

3、如果不用combiner，那么，所有的结果都是reduce完成，效率会相对低下。使用combiner，先完成的map会在本地聚合，提升速度。

4、对于hadoop自带的wordcount的例子，value就是一个叠加的数字，所以map一结束就可以进行reduce的value叠加，而不必要等到所有的map结束再去进行reduce的value叠加。

二、总结

1、combiner使用的合适，可以在满足业务的情况下提升job的速度，如果不合适，则将导致输出的结果不正确。

猜你喜欢

转载自p-x1984.iteye.com/blog/1117599

Map/Reduce中的Combiner的使用

Hadoop map-reduce 实现K-means聚类(combiner的使用)

Map/Reduce中的Partiotioner使用

Hadoop之map/reduce之间的shuffle，partition，combiner过程的详解

map/reduce之间的shuffle，partition，combiner过程的详解

swift中Map,FlatMap,Filter,Reduce的使用

Mapreduce中Combiner的使用及误区

python map reduce的使用

map、filter、reduce的使用

使用reduce实现map

python3中map()和reduce()函数的使用

Hive中的TRANSFORM：使用脚本完成Map/Reduce

Python中lambda、zip、map、reduce函数的使用

Python中map(),filter(),reduce()及sum()的使用方法比较

JavaScript中filter、map、reduce、find和findIndex的基本使用

JS数组中的map()、filter()以及reduce()的基本使用

Python中的map_reduce

Python中map/reduce的用法

Python 中的 Map&Reduce

map-reduce中的组件

mapred代码示例--map阶段使用combiner（归约）

filter map reduce函数的使用

lambda 、map、reduce的简单使用

filter()、map()、reduce()函数的使用

HBase 与Map Reduce的联合使用

filter,map,reduce的基本使用

JavaScript中的reduce的使用

MapReduce的Map阶段的指定Combiner

Python中的map和reduce函数简介

eclipse中运行Map/Reduce程序

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)