MapReduce自定义分区partition的作用和用法 - 代码天地

MapReduce自定义分区partition的作用和用法

其他 2018-12-03 09:11:12 阅读次数: 0

默认分区数量为

key.hash%reducetask的个数

自定义分区

自己定义的

自定义分区很简单，我们只需要继承抽象类Partitioner，重写getPartition方法即可，另外还要给任务设置分区：

job.setPartitionerClass()， job.setNumReduceTasks();

就可以了。

注意：

自定义分区的数量需要和reduce task的数量保持一致。

但是为1也或者大于reducetask也可以，为1的时候所有的数据放到一起，大于的时候则按照分区编号来分

例子

扫描二维码关注公众号，回复： 4340439 查看本文章

import org.apache.hadoop.mapreduce.Partitioner;
public class JiduPartitioner<K, V> extends Partitioner<K, V>{
    @Override
    //自定义partition的数量需要和reduce task数量保持一致
    public int getPartition(K key, V value, int numPartitions) {
        String dname=key.toString();
        switch(dname)
        {
        case "研发部门":return 0;
        case "测试部门":return 1;
        case "硬件部门":return 2;
        case "销售部门":return 3;
        }
        return 4;
    }
}

猜你喜欢

转载自blog.csdn.net/u012580143/article/details/84615507

MapReduce自定义分区partition的作用和用法

MapReduce 自定义分区

mapreduce排序（自定义Partition）

MapReduce的自定义排序、分区和分组

MapReduce中自定义分区

MapReduce自定义分区器partitioner

MapReduce【自定义分区Partitioner】

Hadoop中的MapReduce框架原理、自定义Partitioner步骤、在Job驱动中，设置自定义Partitioner、Partition 分区案例

MR之partition自定义分区器

Hadoop完全分布式用MapReduce实现自定义排序、分区和分组

mapreduce二次排序（自定义分区、分组）

（七）MapReduce自定义类型及分区算法

MapReduce自定义排序、分区、分组案例

MapReduce之Shuffle机制-自定义分区-05

Hadoop学习之路(6)MapReduce自定义分区实现

MapReduce练习案例3 - 自定义分区

自定义的InputFormat和自定义分区

mapreduce自定义分组、自定义分区、二次排序

自定义MapReduce

kafka自定义partition

MapReduce Partition Group 自定义类型输出排序代码示例

mapreduce的自定义排序

HBase自定义MapReduce

mapreduce的自定义类

mapreduce的自定义分组

MapReduce自定义outputFormat

MapReduce 自定义partitioner

MapReduce【自定义OutputFormat】

MapReduce【自定义InputFormat】

MapReduce （8）--MapReduce 自定义outputFormat

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)