UDAF用户自定义聚合函数 - 代码天地

UDAF用户自定义聚合函数

其他 2020-02-26 17:43:16 阅读次数: 0

-UDAF 用户自定义聚合函数

测试数据 复制粘贴即可使用

partition 01  (a,b,c,d,a,b,c,d)  
partition 02  (b,b,c,c,d,d,g,g)  
**实现的方法** 
01.初始化方法	
	override def initialize(buffer: MutableAggregationBuffer): Unit =
	 {
    	buffer(0)=0;
  	}
 （在map 和 reduce 端每个RDD分区内，按照group by的字段 会创建三个初始化值 ）
 1.map端 
  	partition 01 (a,0) (b,0) (c,0) (d,0) 分为四组
    partition 02 (b,0) (c,0) (d,0) (g,0)
 2.reduce端
 	会为每个group by的字段做一个初始化值 相同的字段只会做一次
 	 (a,0) (b,0) (c,0) (d,0) (g,0)

02. updata方法 
	 override def update(buffer: MutableAggregationBuffer, input: Row): Unit =
	  {
  	   buffer(0)=buffer.getAs[Int](0)+1;
	  }
(在map端 作用在每个分区内的每个小组上 通过面逻辑 得到结果 ）
	partition 01 (a,2) (b,2) (c,2) (d,2)
	partition 02 (b,2) (c,2) (d,2) (g,2)
02 merge合并方法
	override def merge(buffer1: MutableAggregationBuffer, buffer2: Row): Unit = 
		{
		  buffer1(0)=buffer1.getAs[Int](0)+buffer2.getAs[Int](0)
		  }
      partition 01 (a,2) (b,2) (c,2) (d,2) 
	  partition 02 (b,2) (c,2) (d,2) (g,2)

猜你喜欢

转载自blog.csdn.net/qq_42890382/article/details/104311908

UDAF用户自定义聚合函数

【Hive七】Hive用户自定义聚合函数(UDAF)

UDAF(用户自定义聚合函数)求众数

SparkSQL用户自定义聚合函数UDAF

SparkSQL用户自定义聚合函数UDAF（新）

Spark UDAF用户自定义聚合函数

pyspark 自定义聚合函数 UDAF

Spark SQL的两种用户自定义聚合函数(UDAF)

sparkSQL自定义聚合函数（UDAF）实现bitmap函数

Hive自定义UDF和聚合函数UDAF

Spark Sql之UDAF自定义聚合函数

Hive自定义聚合函数UDAF(计算中位数)

SparkSQL 用户自定义函数（UDF、UDAF、开窗）

大数据学习之路90-sparkSQL自定义聚合函数UDAF

Hive之——自定义函数UDAF

048 SparkSQL自定义UDAF函数

Hive之——自定义UDAF函数

Spark 自定义函数（udf,udaf）

hive自定义udaf函数

自定义UDAF函数开发详解

Spark UDAF 自定义函数

SparkSQL 自定义函数UDF与UDAF

spark sql 自定义UDAF函数

sparksql用户自定义函数（UDF和聚合函数）

Spark SQL（二十二）用户自定义的UDF、UDAF函数

【Flink】Flink Table & SQL 用户自定义函数: UDF、UDAF、UDTF

Hive之——用户自定义聚合函数

Spark DataFrame 用户自定义（聚合）函数

SparkSQL之用户自定义聚合函数

自定义spark UDAF

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)