Spark五持久化缓存 - 代码天地

Spark五持久化缓存

其他 2018-07-03 01:08:27 阅读次数: 0

原因：每次重算RDD和RDD的依赖，消耗大

原理：计算出RDD的节点分别保存计算出的分区数据

故障：如果出现故障，可以对故障节点分区的数据重算，或者为每个分区保存多个副本

策略：如果持久化数据的存储空间不足，会采用LRU的策略将分区从内存中移除

持久化级别 默认序列化的形式存储在JVM的堆空间中

MEMORY_ONLY

MEMORY_ONLY_SER

MEMORY_AND_DISK

MEMORY_AND_DISK_SER

DISK_ONLY

DISK_ONLY_2 #_2把RDD持久化为两份副本

程序：

package thisisnobody.basic

import org.apache.spark.storage.StorageLevel
import org.apache.spark.{SparkConf, SparkContext}


object test {
  def main(args: Array[String]): Unit = {

    val conf = new SparkConf().setAppName("filter").setMaster("local")
    val sc = new SparkContext(conf)
    val rdd = sc.parallelize(List(1,2,3,4))
    val rdd1 = rdd.filter( x => x != 3)
    rdd1.persist(StorageLevel.MEMORY_ONLY)
    rdd1.foreach(println)

  }
}

> 虽然在行动操作之前调用了persist()，但persist()并没有强制求值，转化操作还是行动操作按需执行

> 使用unpersist()手动把持久化RDD从缓存中删除

猜你喜欢

转载自blog.csdn.net/weixin_42129080/article/details/80885259

Spark五持久化缓存

Spark 持久化(缓存)

spark -- RDD的持久化/缓存

spark_RDD的持久化_缓存

Spark中RDD的持久化/缓存

Spark RDD持久化（缓存），Checkpoint

（四）Spark学习笔记之缓存持久化

大数据开发-Spark-RDD的持久化和缓存

Spark基础学习笔记：RDD持久化、存储级别与缓存

spark从入门到放弃五十三:Spark Streaming(13)缓存于持久化

spark - RDD持久化

【spark】持久化

spark RDD持久化

spark持久化

【SPARK】- RDD持久化

spark的持久化

【Spark】（三）持久化

Spark的RDD持久化

Spark笔记整理（五）：Spark RDD持久化、广播变量和累加器

Spark Streaming（二十七）DStream的转换、输出、缓存持久化、检查点

《Spark Streaming 编程指南核心概念之缓存/持久化、检查点》

Spark基础学习笔记20：RDD持久化、存储级别与缓存

Redis（五）持久化

ActiveMQ(五) 持久化

Spark- RDD持久化

SPARK-RDD持久化

Spark RDD持久化机制

RDD的持久化/缓存

Redis（五）：Redis的持久化

五. Hibernate的持久化编程

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)