[灾备]灾难恢复的衡量指标

[灾备]灾难恢复的衡量指标

运维少年 运维少年

评估一个灾备系统可靠性的两个重要指标是 RTO 与 RPO。
[灾备]灾难恢复的衡量指标
RTO 与 RPO 灾难恢复衡量指标

RTO (Recovery Time Objective) 恢复时间目标。RTO 是指灾难发生后,从系统宕机导致业务停顿之刻开始,到系统恢复至可以支持业务部门运作,业务恢复运营之时,此两点之间的时间。RTO 可简单地描述为企业能容忍的恢复时间。

RPO (Recovery Point Objective) 恢复点目标。RPO 是指灾难发生后,容灾系统能把数据恢复到灾难发生前时间点的数据,它是衡量企业在灾难发生后会丢失多少生产数据的指标。RPO 可简单地描述为企业能容忍的最大数据丢失量。

RTO 针对的是服务时间的丢失,RPO 针对的是数据的丢失,两者是衡量容灾系统的两个主要指标,但它们没有必然的关联性。RTO 和 RPO 的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定,对于不同企业的同一种业务,RTO 和 RPO 的需求也会有所不同。当然,对于组织而言,最好的情况是 RPO=0 ,RTO=0 ,但显然这种情况对很多中小企业而言是理想状态。

此外,随着对业务恢复指标的进一步细分,还可引入降级运行目标 DOO 、网络恢复目标 NRO 、任意时间点回退 APIT 等指标。

DOO (Degraded Operations Objective) 降低运行目标。DOO 是指灾难事件发生期间数据中心不可用时,关键业务系统在灾备中心运行的服务级别允许降低到一个可接受程度。这意味着灾难事件发生时,为了加快恢复速度,可以允许关键业务恢复到一个较低的服务级别,这个事先确定的允许降低的服务级别就是 DOO。

NRO (Network Recovery Objective) 网络恢复目标。NRO 是指在灾难发生后切换到灾备中心所需的时间。在这一预定时间内不仅要求将网络连接从数据中心切换到灾备中心,还要使用户的网络访问能够成功地转移到灾备中心。

APIT (Any Point In Time) 任意时间点回退。APIT 是指在数据发生逻辑错误时,我们需要对破坏的数据进行恢复,这时 CDP 持续数据保护技术的衡量标准可以用任意时间点回退进行评判。

end

猜你喜欢

转载自blog.51cto.com/15082392/2655051