spark使用checkpoint恢复的两个小坑

其他 2020-01-25 10:21:51 阅读次数: 0

1.spark在使用checkpoint恢复的时候不能再执行流的定义的流程，新加入的流的状态在恢复完成后的spark状态下处于未初始化状态，在spark根据checkpoint恢复的时候将不会再对各个流进行初始化，而是直接保存的状态中恢复。

这将导致新加入的流还未初始化就被调用，抛出stream还未初始化的异常。

2.spark在使用checkpoint恢复的过程中，不能恢复kryo序列化的类（比如采用kryo序列化的广播变量）。

在进行checkpoint的过程，直接使用jdk的ObjectOutputStream进行序列化，如果只是实现了kryo序列化接口的类是不能被成功序列化的，自然是无法被写进checkpoint文件中被恢复的。

tydhot

发布了141 篇原创文章 · 获赞 19 · 访问量 10万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_40318210/article/details/102848271

spark使用checkpoint恢复的两个小坑

关于spark persist()的两个坑

今天发现的两个小坑

纪录两个Opencv的小坑

关于sqlmap的两个小坑

mciSendString 的两个小坑

【Spark100】Spark Streaming Checkpoint的一个坑

Docker Registry + redis 遇到的两个小坑

kvm 虚机环境碰到的两个小坑

移动端 IOS的两个小坑

axios环境配置中碰到两个小坑

Spark Streaming的恢复机制——Checkpoint

《Spark Streaming checkpoint 实现状态恢复》

shell脚本中的小坑（空格）--两个小栗子

arduino按钮使用的两个小实验

数据挖掘：分享两个Pandas使用小陷阱

spark on yarn的两个warning

spark streaming的checkpoint使用代码

微信小程序wx.uploadFile 上传文件的两个坑

Socket.IO实现WebSocket的client端两个小坑

微信小程序wx.uploadFile的两个坑

UnityEngine.Random.Range求随机数的两个小坑

jenkins运行报错的两个坑

SimpleDateFormat两个著名的坑

使用Hexo的搭建一个简单的博客（一步两个坑）

使用redis-py的两个类Redis和StrictRedis时遇到的坑

os.listdir以及keras如何使用GPU的两个坑

ScheduledThreadPoolExecutor使用过程中的两个坑

【overleaf】记录overleaf使用时遇到的两个坑以及解决方案

java包的两个小规则

今日推荐

周排行

Grayscale的报告显示，机构投资者接受比特币

任意角度的场景文本检测论文简单总结

努力学习的意义

蒟蒻 Wendigo 表情包

Ubuntu 14.04 Install Sublime Text 3

守卫

python3中request.urlopen()和requests.get()方法的区别

花点时间顺顺Git（下）

docker安装ngnix进行挂载

spring boot 2 统一异常处理

每日归档

2024-06-13(0)

2024-06-12(0)

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)