Spark中RDD 的持久化算子

Spark中RDD持久化算子

1.分类

1.cache

将RDD 的算子默认的保存在内存里面(比磁盘快)

2.persist

手动指定持久化的级别,指定数据存几分

3.checkpoint

存到指定的目录里面

おすすめ

転載: blog.csdn.net/weixin_48929324/article/details/112854499
おすすめ