【Spark三十八】Spark Checkpoint机制 - 代码天地

【Spark三十八】Spark Checkpoint机制

企业开发 2018-05-12 05:35:55 阅读次数: 0

SparkContext中对于checkpoint的操作

  def runJob[T, U: ClassTag](
      rdd: RDD[T],
      func: (TaskContext, Iterator[T]) => U,
      partitions: Seq[Int],
      allowLocal: Boolean,
      resultHandler: (Int, U) => Unit) {
    if (dagScheduler == null) {
      throw new SparkException("SparkContext has been shutdown")
    }
    val callSite = getCallSite
    val cleanedFunc = clean(func)
    logInfo("Starting job: " + callSite.shortForm)
    dagScheduler.runJob(rdd, cleanedFunc, partitions, callSite, allowLocal,
      resultHandler, localProperties.get)
    progressBar.foreach(_.finishAll())
    rdd.doCheckpoint() ///第一次Job执行完成时，将RDD进行checkpoint，注意，此时的RDD是整个Job的最后一个RDD。
  }

RDD的doCheckpoint方法

  /**
   * Performs the checkpointing of this RDD by saving this. It is called after a job using this RDD
   * has completed (therefore the RDD has been materialized and potentially stored in memory).
   * doCheckpoint() is called recursively on the parent RDDs.
   */
  private[spark] def doCheckpoint() {
    if (!doCheckpointCalled) {
      doCheckpointCalled = true
      if (checkpointData.isDefined) {
        checkpointData.get.doCheckpoint()
      } else {
        dependencies.foreach(_.rdd.doCheckpoint())
      }
    }
  }

猜你喜欢

转载自bit1129.iteye.com/blog/2182528

【Spark三十八】Spark Checkpoint机制

Spark checkpoint机制简述

spark-checkpoint机制

Spark | checkpoint机制

Spark cache和checkpoint机制

spark rdd---checkpoint机制

flink超越Spark的Checkpoint机制

spark -- RDD容错机制Checkpoint

【Spark】cache，persist，checkpoint机制

Spark Streaming的恢复机制——Checkpoint

深入浅出Spark的Checkpoint机制

Spark中RDD容错机制Checkpoint

spark的checkpoint

spark笔记之RDD容错机制之checkpoint

spark checkpoint详解

Spark Streaming中的checkpoint

Spark Streaming Checkpoint

Spark-Cache与Checkpoint

Spark-checkPoint

Checkpoint机制

Spark Streaming的还原药水——Checkpoint

[spark 面试] cache/persist/checkpoint

Spark Streaming的checkpoint（更新中）

Spark中cache、persist、checkpoint

spark 的checkpoint与cache、persist的区别

spark streaming的checkpoint使用代码

spark(九)-checkpoint的读写流程

spark中的checkpoint，持久化和checkpoint的区别

Spark（四） -- Spark工作机制

【Spark】Spark内部通信机制

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)