spark中RDD和DataFrame之间的转换 - 代码天地

spark中RDD和DataFrame之间的转换

其他 2019-03-26 23:18:01 阅读次数: 0

今天了解了sparksql的基本知识，并且用scala语言实践了一下RDD和DataFrame之间的转换，代码如下：

package scala
import org.apache.spark.sql.types.StringType
import org.apache.spark.sql.types.StructField
import org.apache.spark.sql.types.StructType
import org.apache.spark.sql.Row
import org.apache.spark.sql.types.IntegerType
import org.apache.spark.sql.types._
import org.apache.spark.sql.SQLContext

import org.apache.spark.SparkConf
import org.apache.spark.SparkContext
import org.apache.spark.SparkConf

object RDD2Dataset {
  
  case class Student(id:Int,name:String,age:Int)
  def main(args:Array[String])
  {

    dynamicCreate()
  }

  private def dynamicCreate():Unit={
     val conf = new SparkConf()
        conf.setMaster("local")  
            .setAppName("scalawordcount")    //设置运行方式为本地      
       val sc = new SparkContext(conf)  
       val employeeRDD = sc.textFile("H:\\student.txt")  //通过RDD读取本地文件
    val schemaString="id,name,age"         
    val fields=schemaString.split(",").map(fieldName => StructField(fieldName, StringType, nullable = true))
    val schema=StructType(fields)
    val rowRDD=employeeRDD.map(_.split(",")).map(parts⇒Row(parts(0),parts(1),parts(2)))
    var sqlContext = new SQLContext(sc)
    val stuDf=sqlContext.createDataFrame(rowRDD, schema)//创建dataframe
       
    val tmpView = stuDf.registerTempTable("student")  //将dataframe数据注册成表，以便于用数据库语句操作
    val nameDf=sqlContext.sql("select * from student")
    //nameDf.write.text("result") //将查询结果写入一个文件
    nameDf.show()

  }

}

猜你喜欢

转载自www.cnblogs.com/zhangliqiangvictory/p/10604515.html

spark中RDD和DataFrame之间的转换

Spark 中RDD和DataSet之间的转换

spark: RDD与DataFrame之间的相互转换

Spark中的RDD和DataFrame

Spark RDD和DataSet与DataFrame转换成RDD

Spark中RDD、DataFrame和DataSet的区别

理解Spark中的RDD、DataFrame和DataSet

RDD、DataSet、DataFrame之间的转换

Spark中RDD,DataFrame和DataSet的区别,联系以及相互转换

Spark DataSet和RDD与DataFrame转换成DataSet

Spark中 DataFrame,DataSet,RDD

Spark中RDD和DataFrame、DataSet的区别?---面试题

Spark中RDD、DataFrame和DataSet三者的区别

Spark-RDD、Dataset、DataFrame互相转换

Spark之RDD与DataFrame互相转换

Spark之RDD、DataSet、DataFrame转换

spark教程(11)-RDD-DF-DS 汇总 Spark中RDD、DataFrame和DataSet的区别

Spark SQL 解析-RDD、DataFrame、Dataset 三者之间转换

Spark中RDD转换成DataFrame的两种方式（分别用Java和Scala实现）

DataFrame和RDD之间的区别以及两者之间的相互转换

Spark DataFrame及RDD与DataSet转换成DataFrame

Spark-Sql快速入门系列(1) | RDD, DataFrame和 DataSet 之间的关系

Spark中RDD与DataFrame与DataSet的区别与联系

spark中RDD，DataSet，DataFrame的区别

Spark中的RDD、DataFrame、Dataset对比

spark中 RDD、DataFrame、Dataset的关系及区别

Spark中RDD、DataSet、DataFrame的联系与区别

spark 中 RDD、DataFrame、Dataset区别

Spark RDD、DataFrame和DataSet的区别

Spark RDD,DataFrame和DataSet的区别

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)