RDD Actions - 代码天地

RDD Actions

其他 2020-01-14 18:19:03 阅读次数: 0

RDD 动作列表

Action	含义
reduce(func)	使用函数func（它接受两个参数并返回一个）来聚合数据集的元素。该函数应该是可交换和关联的，以便可以并行地正确计算它。
collect()	在驱动程序中将数据集的所有元素作为数组返回。在过滤器或其他操作返回足够小的数据子集之后，这通常很有用。
count()	返回数据集中元素的数量。
first()	返回数据集的第一个元素（类似于take（1））。
take(n)	返回包含数据集前n个元素的数组。
takeSample(withReplacement,num,[seed])	返回一个数组，其中包含数据集的num元素的随机样本，包含或不包含替换，可以预先指定一个随机数生成器种子。
takeOrdered(n,[ordering])	使用自然顺序或自定义比较器返回RDD的前n个元素。
saveAsTextFile(path)	将数据集的元素作为文本文件（或文本文件集）写入本地文件系统，HDFS或任何其他Hadoop支持的文件系统中的给定目录中。 Spark在每个元素上调用toString将其转换为文件中的一行文本。
saveAsSequenceFile(path)(Java and Scala)	将数据集的元素作为Hadoop SequenceFile写入本地文件系统，HDFS或任何其他Hadoop支持的文件系统的给定路径中。这在实现Hadoop的Writable接口的键值对的RDD上可用。在Scala中，它也可用于可隐式转换为Writable的类型（Spark包含Int，Double，String等基本类型的转换）。
saveAsObjectFile(path)(Java and Scala)	使用Java序列化以简单的格式写入数据集的元素，然后使用SparkContext.objectFile（）加载该序列化。
countByKey()	仅适用于类型（K，V）的RDD。用（K，Int）对的hashmap返回每个键的计数。
foreach(func)	在数据集的每个元素上运行函数func。这通常是为了副作用而完成的，例如更新累加器或与外部存储系统交互。注意：修改foreach（）之外的累加器以外的变量可能会导致未定义的行为。有关更多详细信息，请参阅了解闭包

*MuYu*

发布了147 篇原创文章 · 获赞 24 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_36535820/article/details/103822736

RDD Actions

Spark的RDD（actions）

spark-common RDD transformations and actions

Spark学习实例(Python)：RDD执行 Actions

RDD算子源码《一》返回一个结果的actions算子

rdd

vuex—actions

Github Actions

Chain of actions

使用redux-actions优化actions管理

What Actions are Needed for Understanding Human Actions in Videos?

RDD编程--创建RDD

【spring statemachine】Using Actions

spark Transformations，Actions

vuex-Actions的用法

vuex学习---Actions

IDEA Save Actions插件

Vuex中actions与mutations

【SpringMVC】指明actions的后缀

vuex（三）actions

Add Inline Actions

Spark中Transformations、Actions

Github Actions 初探

Spark常用Actions算子

yii actions 使用

spark actions 算子

说说 Vuex 的 actions 属性

redux-actions

Vuex（篇3）——actions

JSP-Actions

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)