spark中的RDD是什么，有哪些特性 - 代码天地

spark中的RDD是什么，有哪些特性

其他 2018-10-26 12:11:40 阅读次数: 0

RDD（Resilient Distributed Dataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合。

Dataset：就是一个集合，用于存放数据的
Distributed：分布式，可以并行在集群计算
Resilient：表示弹性的
- 弹性表示
  - 1、RDD中的数据可以存储在内存或者是磁盘

*RDD五大特性：

A list of partitions一个分区列表，RDD中的数据都存在一个分区列表里面
A function for computing each split作用在每一个分区中的函数
A list of dependencies on other RDDs一个RDD依赖于其他多个RDD，这个点很重要，RDD的容错机制就是依据这个特性而来的
Optionally, a Partitioner for key-value RDDs (e.g. to say that the RDD is hash-partitioned)可选的，针对于kv类型的RDD才具有这个特性，作用是决定了数据的来源以及数据处理后的去向
Optionally, a list of preferred locations to compute each split on (e.g. block locations for an HDFS file)可选项，数据本地性，数据位置最优

猜你喜欢

转载自blog.csdn.net/Sunshine_2211468152/article/details/83049968

spark中的RDD是什么，有哪些特性

Spark中RDD是什么？

Spark中RDD之间的依赖关系有哪些？它们的区别是什么？各自对应的算子有哪些？------面试题？

揭秘Spark中RDD算子是什么

Spark——RDD是什么？

spark怎么创建RDD，一个创建RDD的方式有哪些它们的区别是什么！！（Unit2）

React 是什么？有什么特性？有哪些优势？

spark——spark中常说RDD，究竟RDD是什么？

Spark中的RDD是什么？请解释其概念和特点。

spark基础-rdd特性

Spark RDD的特性

什么是RDD?带你快速了解Spark中RDD的概念!

html中的meta标签是什么？有哪些属性？

数据中台定义是什么，作用有哪些?

Python中的错误是什么，Python中有哪些错误

Java中的锁是什么意思，有哪些分类？

Linux中协议栈是什么？其有哪些组件？

RabbitMQ中的Exchange是什么？它有哪些类型？

数据库事物特性是什么？事务的隔离级别有哪些？

ECMAScript是什么？ ES6新增特性有哪些？@zj-zhangjie

抗静电母粒是什么？它有哪些比较实用的特性呢

谷歌、脸书、魔兽世界都在用！InnoDB是什么？有哪些关键特性？

RDD是什么？

mysql默认的存储引擎是什么？它们的区别有哪些？mysql中索引有哪些？

Spark中RDD的理解

什么是事务？事务的特性有哪些？

什么是SpringBoot?SpringBoot有哪些特性？

CORBA是什么？它的用途有哪些

常量是什么？常量的类型有哪些？

RFID是什么，有哪些应用？

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)