spark sql 自定义UDAF函数 - 代码天地

spark sql 自定义UDAF函数

业界资讯 2023-04-09 11:54:50 阅读次数: 0

spark3.0 用户自定义函数
重写Aggregator 方法

import org.apache.spark.{SparkConf, sql}
import org.apache.spark.sql.{Encoder, Encoders, SparkSession, functions}
import org.apache.spark.sql.expressions.Aggregator

object Spark_basic {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setMaster("local[*]").setAppName("waj")
      val spark = SparkSession.builder().config(conf).getOrCreate()
//TODO user defined function
// 创建DataFrame
      val df = spark.read.json("datas/user.json")
      //注册临时表
    df.createTempView("user")
    // 注册udaf 函数
    spark.udf.register("mymean",functions.udaf(new MyAvgUDAF()))
    spark.sql("select mymean(age ) as mean  from user").show()


    spark.close()
  }
  case class Buff(var total:Long,var count:Long)
  class MyAvgUDAF extends Aggregator[Long,Buff,Long]{
    override def zero: Buff = new Buff(0,0L)

    override def reduce(b: Buff, a: Long): Buff = {
      b.count+=1
      b.total+=a
      b
    }

    override def merge(b1: Buff, b2: Buff): Buff = {
      b1.total=b1.total+b2.total
      b1.count=b2.count+b1.count
      b1
    }

    override def finish(reduction: Buff): Long = reduction.total/reduction.count

    override def bufferEncoder: Encoder[Buff] = Encoders.product

    override def outputEncoder: Encoder[Long] = Encoders.scalaLong
  }
}

猜你喜欢

转载自blog.csdn.net/weixin_42529756/article/details/122050824

spark sql 自定义UDAF函数

Spark --Spark SQL自定义函数 UDF UDAF UDTF

Spark Sql之UDAF自定义聚合函数

Spark_SQL自定义函数 UDF UDAF UDTF

Spark_SQL自定义函数 UDF UDAF UDTF

Spark SQL自定义UDF|UDAF

Spark SQL（二十二）用户自定义的UDF、UDAF函数

Spark SQL的两种用户自定义聚合函数(UDAF)

Spark SQL:从入门到精通(四)[ 自定义函数]UDF_UDAF

Spark 自定义函数（udf,udaf）

Spark UDAF 自定义函数

自定义spark UDAF

spark sql自定义函数udf

spark-sql 自定义函数

spark sql自定义函数

Spark SQL：自定义函数(示例)

Spark sql 用户自定义函数

Spark UDAF用户自定义聚合函数

spark中自定义udf，udaf函数

spark--Spark SQL自定义函数-★★★★★

Spark SQL--UDAF函数

Flink-sql自定义UDAF函数

Spark SQL 自定义函数、开窗函数

Spark SQL自定义函数_第五章

16 | Spark SQL 的 UDF（用户自定义函数）

Spark Sql的UDF和UDAF函数

Spark SQL 解析-UDF，UDAF，开窗函数

spark自定义函数之——UDAF使用详解及代码示例

sparkSQL 自定义UDAF函数（强类型的方式）spark3.x

spark案例三用Spark_Sql_UDF自定义函数实现

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)