Spark中aggregate算子详解介绍

在这里插入图片描述


一、Spark中aggregate算子详解介绍

前面文章我们讲解了如何使用 aggregateByKey 来对相同key的值进行分区内和分区间聚合,本文将使用另外一种算子 aggregate 来对数据进行聚合。

  • aggregate 适用于不考虑键的整体聚合操作,它将在整个 RDD 上进行聚合。
  • aggregateByKey 适用于按键对 RDD 进行聚合操作,它会按键分组后,在分组内进行局部聚合,然后在全局上将不同分区内的相同键进行聚合。

1、函数介绍

在 Spark 中,aggregate 是一个用于聚合操作的高级转换算子(Transformation Operator)。它可以对 RDD 中的元素进行聚合,同时

猜你喜欢

转载自blog.csdn.net/m0_47256162/article/details/132348135
今日推荐