运维监控系统PIGOSS BSM 对“实时数据复制”系统的监控管理

前言

        随着应用信息化程度的不断深入,长期积累的业务数据变得价值连城。业务数据备份安全是业务连续性的重要保障; 而同时,业务数据也指导成为企业进行业务分析最有价值的科学依据。 所以,人们纷纷为业务系统建设容灾备份系统,在容灾备份系统中数据复制的实时性要求又成为重中之重,在容灾系统设计中都要严格定义从生产端到容灾端复制业务数据所允许的标准延迟时间(即,RPO指标),确保一旦发生灾备系统切换时,启动的备份系统的业务数据具备完整性、连续性。

        因为容灾系统的运行、数据复制系统的运行在非灾难时期,并不会引起人们普遍关注,即便发生异常也不会影响生产系统的运行,有很大的隐蔽性,一旦发生容灾切换时,才发现备份系统的业务数据不完整,将导致非常严重后果。

        这就要求现有的IT运行监控解决方案必须能够同时支持对实时数据复制系统的监控管理。业务运行监控平台必须在安全生产时期就实时监控所有数据复制组的RPO延迟情况,一旦发现不符合相关业务系统的容灾设计标准,应及时告警,并提示将会影响到哪个业务的切换。

        这里提出了两个新的监控管理课题:

                1)数据存储和灾备体系的多样性,使得业界有多种多样不同的数据复制工具;现有的IT运行监控解决方案需要兼容各类数据复制工具;

                2)数据复制的健康度应当与基础架构监控一样,成为业务健康度监控视图中的重要一环。

         PIGOSS BSM提供专业容灾监控模块为客户提供完善的业务可靠性管理方案,将容灾监控指标作为业务拓扑视图的组成部分,展现业务可用性、可靠性的监控管理全景视图。

1.DB2数据复制的实时监控方案

        DB2的数据复制是通常是通过HADR专业数据复制模块实现的。PIGOSS BSM不仅提供对HADR数据复制组的RPO指标监控(复制延迟时间),还提供对HADR运行状态及性能的实时监控。支持JDBC和AGENT两种监控方式,点击可以查看指标采集的数据结果

2.对oracle 数据复制的GoldenGate的实时监控方案

        Oracle的数据复制是通常是通过Oracle 配套的GoldenGate专业数据复制模块实现的。PIGOSS BSM可以监测GoldenGate的进程状态,数据复制性能,抽取进程长事务指标和RPO延迟时间。点击视图中的测试按钮可以查看指标采集的数据结果集

3.对NAS 数据复制的实时监控方案 

        NAS 的数据复制是通过SnapMirror模块实现的。PIGOSS BSM 可以监测到SnapMirror的进程状态,状态指标,备份存储统计,读写统计,文件指标和RPO延迟。点击可以查看指标采集的数据结果集

4.支持其他数据复制的实时监控

        此外,PIGOSS BSM还支持对 ADG,Ceph,CommVault,Hacmp,InSpurKHA的数据复制实时监控

猜你喜欢

转载自blog.csdn.net/pigoss02/article/details/128001620