java实现spark常用算子之distinct - 代码天地

java实现spark常用算子之distinct

其他 2019-09-27 16:34:46 阅读次数: 0



import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.VoidFunction;

import java.util.Arrays;
import java.util.List;

/**
 * distinct 算子：
 * 简单去重
 *
 */
public class DistinctOperator {
    public static void main(String[] args) {
        SparkConf conf = new SparkConf().setMaster("local").setAppName("distinct");
        JavaSparkContext sc  = new JavaSparkContext(conf);
        List<String> list1 = Arrays.asList("w1","w2","w3","w4","w2");

        JavaRDD<String> list1Rdd = sc.parallelize(list1);

        //此时result有3个分区
        JavaRDD<String> result = list1Rdd.distinct(2);

        result.foreach(new VoidFunction<String>() {
            @Override
            public void call(String s) throws Exception {
                System.err.println(s);
            }
        });

    }
}

微信扫描下图二维码加入博主知识星球,获取更多大数据、人工智能、算法等免费学习资料哦！

猜你喜欢

转载自www.cnblogs.com/guokai870510826/p/11598670.html

java实现spark常用算子之distinct

java实现spark常用算子之Sample

java实现spark常用算子之SaveAsTextFile

java实现spark常用算子之Repartitions

java实现spark常用算子之Union

java实现spark常用算子之frist

java实现spark常用算子之join

java实现spark常用算子之intersection

java实现spark常用算子之groupbykey

java实现spark常用算子之TakeSample

java实现spark常用算子之SortByKey

java实现spark常用算子之Take

spark：distinct算子实现原理

【菜鸟系列】spark常用算子总结（java）--union,intersection,coalesce,repartition,cartesian,distinct

Spark之常用Action算子

java实现spark算子combineByKey

spark笔记之RDD常用的算子操作

Spark学习之常用算子介绍

spark笔记（二）之RDD常用算子

spark技术之常用必备算子

基于java api的spark常用算子

java-spark的各种常用算子的写法

Spark常用transformation算子操作 —— Java版

Spark常用action算子操作 —— Java版

Spark 常用的 Transformation 算子示例 ===> Java 版

spark算子：distinct去重的原理

SPARK算子实例JAVA实现（reduce）

Spark常用算子详解

Spark常用算子总结

Spark常用算子练习

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)