6、确保业务连续性

确保业务连续性

选择业务连续性和灾难恢复流程

业务连续性
一组能使组织在发生不利事件后保持正常业务操作的流程

  • 有血多类型的事件都可能扰乱业务的连续性
  • 由恶意事件引起
  • 由粗心或疏忽而导致
  • 影响可能包括:
  • 数据丢失或泄露
  • 通讯中断
  • 对人员的伤害
  • 以及更多
    灾难恢复
    业务连续性的一个主要组成部分,其重点工作是在灾难后恢复资产
  • 确保IT环境回到工作的基准状态
  • 最重要的步骤之一就是确保业务的连续性
    灾难恢复流程
  • 通知利益相关人
  • 开始紧急行动
  • 评估损害
  • 评估设施
  • 开始恢复过程
    恢复团队
  • 被指派实施恢复程序的个人团队
  • 在紧急情况下需要立即响应
  • 将关键业务流程恢复到正常操作状态的能力
  • 可能包括:
  • 系统经理
  • 系统管理员
  • 安全管理员
  • 设施专家
  • 通讯专家
  • HR员工
  • 法律代表
    恢复顺序
    说明了在灾难恢复过程中优先考虑哪种类型的系统的流程
  • 并非所有系统对组织来说都享有相同的地位
  • 一个组件对业务的重要程度可能大于另一个组件
  • 你必须对损害进行鉴别分类
  • 你可以自定义顺序来满足你的业务需求
  • 例子:有一个使用云存储的公司,他们的数据中心和办公区被洪水淹没了
    1、为数据中心恢复干净、干燥的环境
    2、为数据中心恢复电力
    3、恢复内部数据中心的联网功能
    4、恢复数据中心的存储和处理服务器
    5、恢复数据中心的入站和出站网络
    6、为受影响的普通办公区恢复清洁干燥的环境
    7、恢复工作站功能
    8、恢复办公桌/隔间环境
    恢复站点
  • 可以用作备用站点来恢复系统功能
  • 热站:完整配置的备用网络,可在灾难发生后迅速上线
  • 温站:在正常情况下处于休眠状态或执行非关键功能的站,但如果需要,可迅速转换为关键操作站点
  • 冷战:一个预确定的备用地点,可在灾难发生后重建网络
    安全的恢复
  • 必须包含安全恢复敏感资源的过程
  • 这一过程可能包括
  • 指定受信任的管理员来监督恢复过程
  • 记录恢复流程,系统使用的步骤和数据
  • 在备用恢复站点上继续运行的指南
  • 定期地审核并测试恢复过程
    备份类型
  • 完整:
  • 备份所有文件
  • 大量的存储空和缓慢的备份速度
  • 恢复迅速
  • 差异:
  • 自从上次完整备份以来进行过更改的所有文件
  • 比完整备份需要更少的存储空间和备份时间
  • 恢复缓慢
  • 增量:
  • 自从上次备份(可以是任意一种备份)以来进行过更改的所有文件
  • 比执行差异备份所需的时间更少
  • 恢复最慢
    地理位置方面的考虑
  • 备份媒介必须是安全的,但仍然需要保持可访问
  • 站内存储用于最近的备份
  • 站外存储用于长期备份
  • 站外备份的意义:
  • 将备份存储在较近的距离上能够快速简单地恢复操作
  • 可能容易受到与主站相同的风险
  • 例子:整个地区都将受飓风侵袭
  • 站外备份可能需要在地里位置上进行分离
制定业务连续性计划

灾难恢复计划

  • 帮助组织以最少的时间和金钱损失从事件中恢复过来
  • 重点通常在于恢复IT运营的工作能力
  • 还专注于确保人员的人身安全
  • DRP(disater recovery protocol)可能还包括:
  • 恢复团队的联系信息列表
  • 硬件和软件清单
  • 重要业务和客户信息的记录
  • 程序手册和其他重要信息的记录
  • 备用站点的规格说明
  • 有关备份项目和程序的信息
    IT应急响应计划
    BCP(Business Continuity Planning)业务连续性计划的一个组成部分,指定了灾难发生时可以进行切换的备用IT程序
  • 可能的过渡措施:
  • 在备用站点外操作
  • 使用备用设备或系统
  • 重新安置主要系统
  • 有效性取决于:
  • 关键人员了解何时需要启动计划以及如何启动计划
  • 审核计划,检查其中的各个方面是否到位
  • 培训员工和管理层演练计划
    继任计划
    确保关键业务人员拥有一个或多个可在需要时执行关键职能的指定后援的一种计划
  • 确定了:
  • 作为替补的关键人员
  • 他们代替的人员
  • 他们执行了哪些功能
  • 他们需要进行怎样的培训
    测试演习
    演练、专题研讨会和导向研讨会
    桌面演练
    功能演习
    全方位演习
    行动后报告
    这种事件分析提供了有关在未来如何改进响应流程的深入见解
  • 准确报告发生了什么以及如何进行响应
  • 确定你的组织是否遵循了BCP
  • 确定你的组织是否满足要求
  • 从成功与失败中学习经验能改进流程并优化计划
  • 询问你自己:
  • 发生了什么
  • 组织做了什么
  • 是否遵循了BCP
  • 你未能执行哪些元素
  • 这些元素是否相关
  • BCP是否处理了这种情况
  • BCP中是否有任何缺漏
  • 恢复团队是否很好地履行了他们的职责
  • 是否需要进行任何额外的演习
  • 如果再次出现同样的情况,你会以不同方式进行响应吗
  • 是否需要更改BCP
    指定BCP的准则
  • 确保BCP的全面性
  • 为恢复IT操作指定补充DRP
  • 确保DRP中包含了备份程序和其他关键信息
  • 指定IT应急计划,确保IT程序的连续性
  • 确保IT人员接受了有关此计划的培训
  • 指定退回应急计划,以便迅速恢复错误
  • 指定继任计划,替换关键人员
  • 在BCP中纳入故障转移技术
  • 清点主资产和冗余资产,并将它们一一对应
  • 将备用业务实践纳入BCP
  • 进行测试演习
  • 起草AAR(After Action Review),从成功和失败中学习经验
  • 根据需要修改BCP

猜你喜欢

转载自blog.csdn.net/weixin_44047795/article/details/108980299