Spark SQL 笔记(7)—— DataFrame API操作案例

其他 2018-11-18 03:25:56 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/u012292754/article/details/83628860

1 测试数据

stu.txt

1|Anaa|111111|[email protected]
2|Bob|22222|[email protected]
3|Candy|333333|[email protected]
4|Dany|44444|[email protected]
5|Elf|55555|[email protected]
6|Frank|6666|[email protected]
7|George|777777|George@[email protected]
8|Hlnk|888888|[email protected]
9||999999|[email protected]
10||101010|[email protected]
11|NULL|121212|[email protected]

2 测试代码

package com.tzb.demo2

import org.apache.spark.sql.SparkSession


object DataFrameTest {
  def main(args: Array[String]): Unit = {

    val spark = SparkSession.builder().appName("DataFrameAPITest").master("local[2]").getOrCreate()

    val rdd = spark.sparkContext.textFile("file:///d://stu.txt")

    import spark.implicits._
    val stuDF = rdd.map(_.split("\\|")).map(line => {
      Stu(line(0).toInt, line(1), line(2), line(3))
    }).toDF()

    //默认只显示20条
   // stuDF.show()

    //stuDF.take(10).foreach(println)

    stuDF.first()
    stuDF.head(3)

    //stuDF.select("email").show(20,false)
    //stuDF.select("name","email").show(20,false)

   // stuDF.filter("name=''").show()
    //stuDF.filter("name='' OR name='NULL'").show()

    //查看 name 以 H开头的人
    //stuDF.filter("SUBSTR(name,0,1)='H'").show()

    //stuDF.sort(stuDF("name")).show()
    //stuDF.sort(stuDF("name").desc).show()

    //stuDF.sort(stuDF("name").asc,stuDF("id").desc).show()

    val stuDF2 = rdd.map(_.split("\\|")).map(line => {
      Stu(line(0).toInt, line(1), line(2), line(3))
    }).toDF()

    stuDF.join(stuDF2,stuDF.col("id")===stuDF2.col("id")).show()


    spark.stop()

  }

  case class Stu(id: Int, name: String, phone: String, email: String)

}

猜你喜欢

转载自blog.csdn.net/u012292754/article/details/83628860

Spark SQL 笔记(7)—— DataFrame API操作案例

1３ | Spark SQL 的 DataFrame API

Spark-SQL之DataFrame操作大全

Spark-SQL之DataFrame操作

Spark Sql教程(2）———DataFrame基本操作

14 | Spark SQL 的 DataFrame API 读取CSV 操作

spark SQL and DataFrame(一)

Spark 的 dataframe 和 sql

Spark-Spark SQL and DataFrame

大数据之Spark Sql（二）：DataFrame、创建DataFrame、DataFrame API实现

spark笔记之DataFrame常用操作

Python+Spark2.0+hadoop学习笔记——RDD、DataFrame和Spark SQL数据库相关操作

Spark SQL 笔记(19)——spark SQL 总结(2) DataFrame VS SQL

Spark SQL实战(04)-API编程之DataFrame

Spark SQL之 Dataframe/Dataset

Spark_DataFrame vs SQL

Spark SQL实战(06)-RDD与DataFrame的互操作

spark笔记之DataFrame

spark - DataFrame Api 练习

Spark DataFrame常用操作

spark的DataFrame常用操作

spark dataframe笔记 -- dataframe行转列

Spark DataFrame、Spark SQL、Spark Streaming入门教程

spark dataframe笔记（链接汇总）

Spark复习五：DataFrame API操作

Spark SQL与DataFrame详解以及使用

了解Spark SQL，DataFrame和数据集

Spark SQL的介绍和DataFrame的建立及使用

Spark SQL中创建 DataFrame 方法

Spark SQL-DataFrame，DataSet与RDD

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)