菠菜源码下载与spark 基础（一）RDD - 代码天地

菠菜源码下载与spark 基础（一）RDD

企业开发 2018-08-28 09:41:20 阅读次数: 0

RDD resilient distributed dataset 菠菜源码下载Q2152876294 论坛：diguaym.com 弹性分布式数据集

在spark 中对数据的所有操作均可归类为:创建RDD，转化已有RDD，调用RDD操作求值。

每个RDD可以被分为多个分区，这些分区运行在集群的不同节点上，RDD可以包含python，scala，java等任意类型的对象。

创建RDD方法;

1 读取外部数据集 SparkContext.textFile

2 在驱动程序中分发驱动程序中的对象集合

RDD支持两种操作：

1转化操作 transformation 由一个RDD生成新的RDD

2行动操作action 对RDD计算出一个结果，并将结果返回到驱动器程序中，或存放到外部存储系统（HDFS）

只在首次调用一个行动操作时才会真正计算；

每次进行行动操作时RDD会重新计算，如果想要重复使用一个RDD，则需要用RDD.persist()缓存到内存或者磁盘上，实际操作中经常会将数据的一部分读取到内存中，反复查询。

二创建RDD

程序中已有的集合传给sparkcontext sc.parralelize()

读取外部数据 sc.textFile()

三 RDD操作

转化操作从一个RDD生成另一个RDD

spark会使用谱系图记录RDD间的依赖关系

行动操作对RDD 操作得出结果反馈给驱动程序或者输出 collect 会把RDD的数据存放在本地内存中，写到HDFS或S3 saveAsTextFile（） saveAsSequenceFile（）

四向Spark传递函数

转化操作和行动操作依赖于用户传递的函数计算 python scala 和Java均可实现，前两者支持匿名函数

Function<T,R> 实现方法 R call (T)

Function2<T1,T2,R> 实现方法 R call (T1,T2)

FlatMapFunction<T,R> 实现方法 Iterable<R> call (T)

五常见的转化操作和行动操作

针对各个元素的转化操作 map(),filter()

对每个元素生成多个输出元素 flatmap()返回值序列的迭代器

猜你喜欢

转载自blog.51cto.com/13942787/2165216

菠菜源码下载与spark 基础（一）RDD

Spark基础入门（一）--------RDD基础

spark源码《一》RDD

spark学习笔记[一] —— RDD编程基础

spark 基础一：基本工作原理与RDD

h--5--菠菜源码下载java基础概念

Spark基础 | RDD编程

Spark基础-RDD编程

Spark之RDD基础

Spark RDD基础操作

spark基础-rdd特性

spark基础--rdd的生成

Spark基础和RDD

Spark基础学习——RDD

Spark_RDD之RDD基础

spark源码阅读笔记RDD（一）RDD的基本概念

Spark RDD （一）

Spark(一)RDD

spark Pair RDD 基础操作

【Spark学习】RDD基础练习

Spark：RDD简介及基础算子

spark学习笔记--RDD基础

Spark基础学习——RDD算子

spark RDD常用算子（一）

Spark基础 -- Spark Shell -- RDD -- 算子

菠菜源码搭建与java基础概念

创建RDD《一》textFile源码

菠菜源码-下载Spark SQLQ2152876294源码分析之核心流程

Spark基础入门（二）--------DAG与RDD依赖

Spark MLlib 学习入门笔记 - RDD基础

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)