【Spark学习笔记】2、Java版-算子系列之filter(f:T => Boolean) : RDD[T] => RDD[T] - 代码天地

【Spark学习笔记】2、Java版-算子系列之filter(f:T => Boolean) : RDD[T] => RDD[T]

编程语言 2019-02-28 18:13:04 阅读次数: 0

filter算子源码

def filter(f: T => Boolean): RDD[T] = withScope {
  val cleanF = sc.clean(f)
  new MapPartitionsRDD[T, T](
    this,
    (context, pid, iter) => iter.filter(cleanF),
    preservesPartitioning = true)
}

Java代码demo

public class FilterOperator {

	public static void main(String[] args) {
		SparkConf conf = new SparkConf().setAppName("FilterOperator").setMaster("local[2]");
		JavaSparkContext sc = new JavaSparkContext(conf);

		List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
		JavaRDD<Integer> numberRDD = sc.parallelize(numbers);

		/**
		 * Return a new dataset formed by selecting those elements of the source on which func returns true.
		 * 
		 * filter算子是过滤，逻辑返回true保留，false就过滤掉
		 */

		JavaRDD<Integer> results = numberRDD.filter(new Function<Integer, Boolean>() {
			private static final long serialVersionUID = 1L;

			@Override
			public Boolean call(Integer number) throws Exception {
				return number % 2 == 0;
			}
		});
		results.foreach(new VoidFunction<Integer>() {
			private static final long serialVersionUID = 1L;

			@Override
			public void call(Integer result) throws Exception {
				System.out.println(result);
			}
		});
		sc.close();
	}
}

输出

2
4

猜你喜欢

转载自blog.csdn.net/hellboy0621/article/details/88021942

【Spark学习笔记】2、Java版-算子系列之filter(f:T => Boolean) : RDD[T] => RDD[T]

repartition(numPartitions:Int):RDD[T]和coalesce(numPartitions:Int，shuffle:Boolean=false):RDD[T]的区别

【Spark学习笔记】5、Java版-算子系列之mapPartitions(f:Iterator[T] => Iterator[U]) : RDD[T] => RDD[U]

spark RDD和RDD算子

spark之RDD算子

RDD的算子

RDD算子

【RDD算子】

rdd

RDD编程-RDD算子的使用

Spark RDD

[Spark]-RDD

Spark | RDD

spark --RDD

spark==RDD

spark的RDD

【Spark】RDD

Spark 之RDD算子的整理

Spark之RDD算子练习

Spark之RDD算子总汇

Spark RDD 常用算子

spark的RDD高级算子

spark的rdd算子

spark RDD算子大全

Spark-RDD算子

【Spark】RDD行动算子

Spark的RDD行动算子

Spark RDD算子

spark RDD算子总结

Spark-RDD特点及RDD算子

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)