提高spark任务稳定性的解决方案及Blacklist 机制说明解释 - 代码天地

提高spark任务稳定性的解决方案及Blacklist 机制说明解释

其他 2020-02-08 13:08:10 阅读次数: 0

分布式集群中，特别是高负载的情况下，就会引发很多意想不到的问题，例如：
1、坏盘/硬盘满将会导致 /path/to/usercache 目录创建失败，一个stage中任务失败次数达到一定次数（spark.task.maxFailures）会导致整个job失败。
2、executor 注册 external shuffle service 超时。
3、executor 从 external shuffle service 获取数据超时，task 反复失败后导致了整个stage 的失败。
4、环境依赖问题，例如 xxx 包不存在， xxx 包没有安装。
5、dns 没有配置，网络不通。
...

为什么 task 失败后还会被 schedular 重新调度在原来的 node 或是 executor上？
数据本地性(spark会优先把task调度在有相应数据的节点上)导致。
是否只能听天由命，每次失败后重新调度？如果任务有SLA的限制怎么办？

spark 2.1 中增加了 blacklist 机制，当前(2.3.0)还是

猜你喜欢

转载自blog.csdn.net/as4589sd/article/details/104194495

提高spark任务稳定性的解决方案及Blacklist 机制说明解释

STP稳定性机制

稳定性建设遇到的问题和解决方案

不用数学公式来解释Lyapunov稳定性

使用重试机制保证SpringBoot应用的稳定性

spark submit 参数解释说明及调优

模型训练过程中，混合精度训练稳定性解决方案

kaggle酶稳定性预测第三名解决方案分享

RocketMQ on openEuler 提供高性能消息队列的稳定性解决方案

热门方案丨i.MX6Q高稳定性的360°环视解决方案

吞吐量、并发、PV、UV、稳定性、性能等的解释

提高CUI测试稳定性技术

如何提高系统稳定性？

书本翻页实现机制、方案及说明

飞凌嵌入式丨i.MX6Q高稳定性的360°环视解决方案

【稳定性day10】美团MySQL的高可用架构 - 对标业内的一些解决方案

基于FETMX6Q-C核心板实现的高稳定性的360°环视解决方案

【解决方案】结合SkeyeVSS、SkeyeIVMS搭建高稳定性高速公路监控管理系统

稳定性和高可用如何保障？一手测评华为云网站高可用解决方案

深度学习模型数值稳定性——梯度衰减和梯度爆炸的说明

Java 程序GC机制及性能稳定性调优分析

解析Java异常机制：捕获编程中的错误，保障代码稳定性

服务稳定性及应用防护方案

--解释？说明：--

Spark的相关概念说明和检查点机制

分享从零开始学习网络设备配置--任务2.7 提高网络稳定性（VRRP）

谈谈我是如何提高Selenium Grid的稳定性的

Vuforia提高识别以及稳定性方法总结

UI自动化如何提高稳定性：

提高电网的稳态稳定性(Matlab代码实现）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)