spark scala-实现udf函数 - 代码天地

spark scala-实现udf函数

其他 2018-05-16 22:28:39 阅读次数: 3

本文章主要通过spark实现udf自定义函数

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.sql.SQLContext
import org.apache.spark.sql.Row
import org.apache.spark.sql.types.StructType
import org.apache.spark.sql.types.StructField
import org.apache.spark.sql.types.StringType

/**
 * @author jhp
  *         spark实现udf功能
 */
object UDF {
  
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf()
        .setMaster("local") 
        .setAppName("UDF")
    val sc = new SparkContext(conf)
    val sqlContext = new SQLContext(sc)
  
    // 构造模拟数据
    val names = Array("Leo", "Marry", "Jack", "Tom") 
    val namesRDD = sc.parallelize(names, 5) 
    val namesRowRDD = namesRDD.map { name => Row(name) }
    val structType = StructType(Array(StructField("name", StringType, true)))  
    val namesDF = sqlContext.createDataFrame(namesRowRDD, structType) 
    
    // 注册一张names表
    namesDF.registerTempTable("names")  
    
    // 定义和注册自定义函数
    // 定义函数：自己写匿名函数
    // 注册函数：SQLContext.udf.register()
    sqlContext.udf.register("strLen", (str: String) => str.length()) 
  
    // 使用自定义函数
    sqlContext.sql("select name,strLen(name) from names")
        .collect()
        .foreach(println)  
  }
  
}

猜你喜欢

转载自blog.csdn.net/qq_18603599/article/details/79970073

spark scala-实现udf函数

spark scala-自定义hive函数

Spark使用UDF函数之WordCount实现

spark scala-基础action操作

spark streaming scala-统计热门产品

spark scala-读取各类数据源

spark案例三用Spark_Sql_UDF自定义函数实现

scala spark

Spark & Scala：

scala in spark

spark的scala

Spark Sql的UDF和UDAF函数

spark sql自定义函数udf

Spark SQL 解析-UDF，UDAF，开窗函数

Spark、Hive UDF函数使用汇总

Spark 自定义函数（udf,udaf）

Spark UDF用户自定义函数

Spark自定义函数UDF

spark学习记录（十二、Spark UDF&UDAF&开窗函数）

Spark --Spark SQL自定义函数 UDF UDAF UDTF

spark sql中的udf和udaf实现

Scala-构造函数

为什么建议在Spark中使用Scala定义UDF

Spark（6）——Spark与scala交互

Spark之UDF

Spark UDF 学习笔记

Spark SQL UDF示例

Spark - 动态注册UDF

Spark SQL UDF开发

Scala-方法和函数

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)