spark-dataframe与rdd的区别 - 代码天地

spark-dataframe与rdd的区别

其他 2019-01-05 09:10:58 阅读次数: 0

一：存储

在这里插入图片描述

1.RDD[Person]是以Person为类型参数，但是，Person类的内部结构对于RDD而言却是不可知的。
2.DataFrame是一种以RDD为基础的分布式数据集，也就是分布式的Row对象的集合（每个Row对象代表一行记录），提供了详细的结构信息，也就是我们经常说的模式（schema），Spark SQL可以清楚地知道该数据集中包含哪些列、每列的名称和类型。

二：计算

在这里插入图片描述

rdd：表示一个类，笼统 scala、java开发，运营在jvm上
dataframe：是一个二维的表格，信息更具体，更加深度的优化schema信息（列裁剪，行过滤）查hive很方便，结构化的，逻辑执行计划，物理执行计划

三：RDD

RDD
优点:

编译时类型安全
编译时就能检查出类型错误
面向对象的编程风格
直接通过类名点的方式来操作数据
缺点:

序列化和反序列化的性能开销
无论是集群间的通信, 还是IO操作都需要对对象的结构和数据进行序列化和反序列化.
GC的性能开销
频繁的创建和销毁对象, 势必会增加GC

四：DataFrame

不受JVM的限制, 也就不再收GC的困扰了.

通过schema和off-heap, DataFrame解决了RDD的缺点, 但是却丢了RDD的优点. DataFrame不是类型安全的, API也不是面向对象风格的.## 标题

猜你喜欢

转载自blog.csdn.net/qq_43688472/article/details/85395739

spark-dataframe与rdd的区别

Spark-DataFrame、DataSet、RDD的区别

Spark RDD、DataFrame和DataSet的区别

Spark RDD,DataFrame和DataSet的区别

Spark中RDD与DataFrame与DataSet的区别与联系

spark中RDD，DataSet，DataFrame的区别

Spark中RDD、DataFrame和DataSet的区别

spark之DataFrame、DataSet、RDD的区别

spark中 RDD、DataFrame、Dataset的关系及区别

Spark中RDD、DataSet、DataFrame的联系与区别

spark 中 RDD、DataFrame、Dataset区别

spark - RDD转成DataFrame

spark RDD 生成 DataFrame

spark dataframe -> rdd

Spark RDD转DataFrame

Spark中RDD和DataFrame、DataSet的区别?---面试题

【spark】五 RDD、DataFrame.write 存储API的使用与区别

Spark中RDD、DataFrame和DataSet三者的区别

spark教程(11)-RDD-DF-DS 汇总 Spark中RDD、DataFrame和DataSet的区别

DataFrame与RDD的区别

RDD和DataFrame的区别

DataFrame 和 RDD 的区别

RDD、DataFrame、DataSet的区别

APACHE SPARK: RDD, DATAFRAME OR DATASET?

Spark中的RDD和DataFrame

Spark中 DataFrame,DataSet,RDD

Spark将RDD转DataFrame

Spark将DataFrame转RDD

Rdd,DataFrame和DataSet的区别

RDD、DataFrame和DataSet的区别

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)