Spark中countByKey算子详解介绍

在这里插入图片描述

一、Spark中countByKey算子详解介绍

对于wordcount这个任务之前我们是使用 reduceByKey 来进行相同key的值进行聚合,获取每个key对应的值有多少,本文将介绍另外一个更为方便的算子 countByKey ,使用它直接就会返回每种key对应的值有多少,以map形式返回。

1、函数介绍

在 Spark 中,countByKey 是一种用于对键值对 RDD 进行操作的行动算子(Action Operator)。它用于统计每个键对应的元素个数,返回一个表示每个键对应元素个数的映射(Map)。

语法:

 

猜你喜欢

转载自blog.csdn.net/m0_47256162/article/details/132353996