sparksql join用法 - 代码天地

sparksql join用法

其他 2018-10-06 11:57:32 阅读次数: 0

package com.ws.sparksql
import org.apache.spark.sql.{DataFrame, Dataset, SparkSession}
/**
  * sparksql join ： 与mysql 的join 一样用法
  */
object JoinDemo {
  def main(args: Array[String]): Unit = {

    val spark = SparkSession.builder().appName("JoinDemo").master("local[*]").getOrCreate()

    import spark.implicits._
    val subjectData: Dataset[String] = spark.createDataset(List("1,math,98", "2,math,60", "3,math,50"))

    val sb: Dataset[(Int, String, Int)] = subjectData.map(l => {
      val fields = l.split(",")
      val id = fields(0).toInt
      val subject = fields(1)
      val score = fields(2).toInt
      (id, subject, score)
    })

    val studentData: Dataset[String] = spark.createDataset(List("1,大宝", "2,渣渣", "3,55"))

    val student: Dataset[(Int, String)] = studentData.map(l => {
      val fields = l.split(",")
      val id = fields(0).toInt
      val name = fields(1)
      (id, name)
    })

    val stDataFrame: DataFrame = student.toDF("sid", "name")
    val sbDataFrame = sb.toDF("uid", "math", "score")

    //dataFrame方式
    //val result = sbDataFrame.join(stDataFrame, $"uid" === $"sid", "right")

    //spark sql方式
    sbDataFrame.createTempView("t_sb")
    stDataFrame.createTempView("t_student")
    val result = spark.sql(" select t.* , s.name from t_sb t join t_student s on  t.uid = s.sid")

    result.show()

    spark.stop()
  }
}

结果 :

+---+----+-----+----+
|uid|math|score|name|
+---+----+-----+----+
|  1|math|   98|  大宝|
|  2|math|   60|  渣渣|
|  3|math|   50|  55|
+---+----+-----+----+

猜你喜欢

转载自blog.csdn.net/bb23417274/article/details/82948753

sparksql join用法

sparksql的 join机制

SparkSql -join及写入mysql

sparksql优化之join

sparksql中dataframe的用法

SparkSQL的3种Join实现

sparksql系列(三) sparksql列操作、窗口函数、join

sparkSQL的三种join实现

sparksql

Spark的基本结构及SparkSQL组件的基本用法

SparkSQL大数据实战：揭开Join的神秘面纱

sparksql--join关联执行情况

spark-spark-SparkSQL的3种Join实现(转)

[转]SparkSQL – 有必要坐下来聊聊Join

拾壹SparkSQL-join:不同的关联形式与实现机制

SparkSQL（上）--SparkSQL简介

join 用法

.join的用法

join的用法

JOIN用法

.join用法

SparkSQL 之 Shuffle Join 内核原理及应用深度剖析-Spark商业源码实战

sparksql(2)

sparkSQL学习

SparkSQL简介

Hive & SparkSQL

SparkSQL Catalog

sparkSQL 应用

SparkSQL介绍

初识SparkSQL

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)