【数据仓库】数据仓库稳定性保障实践

 数据业务架构介绍

稳定性目标与保障

少出事

核心链路数据准确率:全年>=99,45%(2次/年)


快发现

核心链路问题(主动发现)时间 <= 5min



快恢复


P0核心链路恢复时间<= 5min:P1级(埋点相关指标,容忍度相对高)链路恢复时间 <= 10in

容量规划 - 容量监控

 监控指标

发布规范

发布窗口


1、业务低峰期,非节假日前一天

2、离线12-16点,实时20-24点

3、非变更窗口需走紧急变更流程


发布内容、发布通知


1、发布背景、执行操作需描述清楚

2、通知业务方、执行方、次日Oncall


审核


1、方向负责人、组负责人审核
2、遵循Doris使用规范
3、不变更就必然产生稳定性风险或无法故障恢复情况下可提前变更,事后补充


四、验收


1、服务稳定性验收

2、服务功能性验收

3、异常快速回滚

猜你喜欢

转载自blog.csdn.net/wenchun001/article/details/131561503
今日推荐