Notas de estudo do CISSP: Plano de recuperação de desastres

Capítulo 18 Plano de Recuperação de Desastres

18.1 A natureza do desastre

  • Os planos de recuperação de desastres giram em torno do encerramento das operações normais da organização, trazendo o funcionamento normal para um momento caótico
  • Os planos de recuperação de desastres devem ser configurados para serem quase automáticos

18.1.1 Desastres naturais

  • Terremotos: grande parte dos EUA experimentou eventos sísmicos de magnitude pelo menos moderada
  • enchente:
  • tempestade:
  • Fogo:
  • Outros eventos regionais: Desastres naturais regionais em certas áreas do mundo

18.1.2 Desastres provocados pelo homem

  • Fogo:
  • Atos Terroristas: Os atos terroristas são imprevisíveis e apresentam desafios especiais para a equipe do DRP
  • Explosão/vazamento de gás:
  • Queda de energia: O plano mais básico de recuperação de desastres também inclui métodos para responder à ameaça de falta de energia de curto prazo. Negócios críticos usam UPS.

18.1.3 Falha de outras instalações e infraestruturas públicas

  1. Falha de hardware/software
    • Os componentes de hardware podem ficar desgastados e não funcionar mais ou podem ser fisicamente danificados
    • Devido a restrições financeiras, nem sempre é possível manter um sistema totalmente redundante
  2. greve/manifestação
    • Os desastres provocados pelo homem podem assumir a forma de greves ou outras crises laborais
  3. roubo/vandalismo
    • Os planos de continuidade de negócios e planos de recuperação de desastres devem incluir medidas preventivas adequadas para controlar a frequência destes eventos

18.2 Compreender a recuperação do sistema e a tolerância a falhas

  • Os controlos técnicos que aumentam a resiliência do sistema e a tolerância a falhas afectarão directamente a disponibilidade.O principal objectivo da recuperação do sistema e da tolerância a falhas é destruir pontos únicos de falha.
  • Um único ponto de falha pode ocorrer em qualquer componente e causar o colapso de todo o sistema.
  • A tolerância a falhas refere-se à capacidade de um sistema continuar operando apesar de uma falha.
  • A resiliência do sistema refere-se à capacidade do sistema de manter níveis de serviço aceitáveis ​​quando ocorrem eventos adversos.

18.2.1 Protegendo unidades de disco

  • Uma maneira comum de adicionar componentes de tolerância a falhas e recuperação do sistema é adicionar uma matriz redundante de discos (RAID)
  • Configurações RAID comuns:
    • RAID-0: chamado striping, usa dois ou mais discos para melhorar o desempenho do sistema de disco
    • RAID-1: chamado de espelhamento, usa dois discos e contém as mesmas informações de dados para obter alta disponibilidade
    • RAID-5: chamado de paridade, usa três ou mais discos, 1 ruim irá desacelerar as coisas
    • RAID-10: Espelhamento distribuído, usando pelo menos 4 discos, melhora a disponibilidade e o desempenho

18.2.2 Protegendo o servidor

  • Um cluster de failover consiste em dois ou mais servidores. Se um servidor falhar, os outros servidores assumem a carga por meio de um processo automatizado chamado failover.

18.2.3 Proteção da fonte de alimentação

  • Fontes de alimentação ininterruptas (UPS), geradores ou ambos fornecem tolerância a falhas, com o UPS fornecendo energia por 5 a 30 minutos e os geradores fornecendo energia de longo prazo

18.2.4 Recuperação confiável

  • A recuperação confiável garante que o sistema possa ser restaurado ao seu estado anterior após uma falha ou travamento. A restauração é dividida em restauração automática e intervenção manual do administrador.
  • Os sistemas podem ser pré-fabricados para serem à prova de falhas ou abertos de emergência em caso de danos
  • Quatro tipos de recuperação confiável:
    • Recuperação manual
    • recuperação automática
    • Recuperação automatizada sem perdas excessivas: O sistema pode executar automaticamente o processo de recuperação, incluindo a recuperação de dados e outros objetos
    • Recuperação de função: Os sistemas que suportam a recuperação de função podem restaurar automaticamente certas funções

18.2.5 Qualidade do serviço

  • Os controles QOS (Qualidade de Serviço) protegem a integridade das redes de dados sob carga:
  • Fatores de QOS:
    • banda larga
    • atraso
    • Tremor
    • Perda de pacotes
    • interferência

18.3 Estratégia de recuperação

  • O plano de recuperação de desastres deverá poder funcionar quase automaticamente e começar a apoiar operações de recuperação
  • Além de melhorar a capacidade de resposta, o seguro também pode reduzir perdas financeiras
  • O seguro administrativo válido cobre documentos e manuscritos registrados, digitados ou escritos

18.3.1 Priorizar unidades de negócios

  • Os negócios com maior prioridade são restaurados primeiro

18.3.2 Gestão de crises

  • A gestão de crises é uma ciência e tecnologia e, se o orçamento para formação permitir, a formação em crises é uma boa ideia

18.3.3 Acesso de emergência

  • Quando ocorre um desastre, é importante que as organizações sejam capazes de comunicar interna e externamente

18.3.4 Recuperação de grupo de trabalho

  • O objetivo de um plano de recuperação de desastres é retornar o grupo de trabalho ao estado normal e retomar o trabalho diário
  • Para facilitar este esforço, a melhor abordagem seria desenvolver instalações de recuperação separadas para diferentes grupos de trabalho.

18.3.5 Locais de trabalho alternativos

  • Um dos elementos importantes de um plano de recuperação de desastres é selecionar um local de trabalho alternativo caso o local de trabalho principal fique indisponível.
    • Pontos frios: Um local grande o suficiente para lidar com as operações organizacionais, com suporte de ambiente eletrônico apropriado, sem instalações informáticas pré-instaladas e sem links de banda larga para comunicações, relativamente barato.
    • Hot site: O layout do edifício possui instalações de trabalho fixas e mantidas, e é rico em servidores completos, estações de trabalho e equipamentos de link de comunicação. Os servidores e estações de trabalho são pré-configurados e equipados com sistemas operacionais e softwares aplicativos apropriados. Servidores Os dados são de até data
    • Warm site: entre hot site e cold site, incluindo equipamentos e linhas de dados, excluindo dados de backup do cliente, a reativação do site levará pelo menos 12 horas
    • Site Móvel: Um trailer ou outra unidade facilmente relocável que consiste em equipamentos originários e todos os sistemas ambientais necessários para manter um ambiente de computador seguro
    • Bureau de Serviços: Uma empresa que aluga tempo de computador, adquire algum poder de processamento e pode fornecer suporte para necessidades de TI em caso de falha.
    • Computação em Nuvem: Capacidade de evitar a maioria dos custos operacionais antes que um site em nuvem seja ativado

18.3.6 Acordo de Assistência Mútua

  • Ajudar-se mutuamente em caso de desastre, compartilhando instalações de informática ou outros recursos
  • Desvantagens do protocolo MAA:
    • difícil de aplicar
    • podem estar sujeitos às mesmas ameaças
    • Confidencialidade

18.3.7 Recuperação de banco de dados

  • É importante que o resumo do plano de recuperação de desastres inclua técnicas de recuperação de dados
  • Principais meios técnicos para recuperação de banco de dados
    • Vinculação eletrônica: os backups de bancos de dados estão sendo movidos para um local remoto por meio de transferência em massa, exigindo testes de soluções de backup
    • Processamento remoto de logs: completa a transmissão de dados de forma mais rápida, em lotes, mas ocorre com mais frequência,
    • Espelhamento remoto: a solução de backup de banco de dados mais avançada e mais cara. O servidor de banco de dados em tempo real é mantido no local de backup.

18.4 Desenvolvimento do plano de recuperação

18.4.1 Resposta a emergências

  • Instruções simples, mas abrangentes, que o pessoal-chave deve seguir imediatamente se for afetado por um desastre ou por um desastre iminente

18.4.2 Notificação de pessoal

  • Mantenha uma lista de pessoas para contatar em caso de desastre

18.4.3 Avaliação

  • A tarefa da equipe de recuperação de desastres ao chegar ao local é avaliar a situação atual

18.4.4 Backup e armazenamento externo

Backup completo : armazena uma cópia completa dos dados contidos no dispositivo protegido, com o bit de arquivo de cada arquivo redefinido, desativado ou definido como 0

Backup incremental : armazena apenas todos os arquivos que foram modificados desde o backup completo mais recente. O backup incremental apenas copia arquivos com o bit de arquivo ativado, habilitado e com facilidade de 1. Uma vez concluído o backup, ele é redefinido, desativado ou definir como 0

Backup diferencial : armazena todos os arquivos que foram modificados desde o backup completo mais recente. O backup diferencial copia apenas arquivos com o bit de arquivo ativado, habilitado ou definido como 1.

  1. Formato de mídia de backup
    • Armazenamento de dados digitais (DDS)/fita de áudio digital (DAT)
    • Fita Linear Digital (DLT) e Super DLT
    • Tecnologia Linear Tape Open (LTO)
  2. Backup fita a fita (D2D)
    • As organizações que adotam uma abordagem completa de backup de fita para disco devem garantir a diversidade geográfica
  3. Melhores práticas de backup
    • O volume de backup de dados aumenta com o tempo
    • Com backups regulares, sempre existe a possibilidade de perda de dados dos quais o backup depende
    • Finalmente, o processo de recuperação da organização precisa ser testado
  4. rotação da fita
    • Estratégia de rotação de fita: (teste GFS, teste Hanro Tower, backup semanal de seis fitas), software de backup comercial, sistema de gerenciamento de armazenamento em camadas totalmente automático para implementar estratégia de backup automático

18.4.5 Contrato de Hospedagem de Software

  • O contrato de hospedagem de software protege a empresa de ser afetada por falhas de código do desenvolvedor do software e evita que o produto perca suporte técnico devido à falência do desenvolvedor do software.

18.4.6 Comunicação externa

  • Durante a recuperação de desastres, é necessário comunicar com diferentes entidades externas à organização

18.4.7 Utilitários

  • O plano de recuperação de desastres deve incluir informações e medidas relevantes para resolver problemas com estes serviços durante um desastre.

18.4.8 Logística e Fornecimento

  • Questões logísticas nas operações de recuperação de desastres merecem destaque

18.4.9 Recuperação vs. restauração

  • As equipes de resgate devem garantir a confiabilidade da nova infraestrutura de TI
  • Após a conclusão de todo o trabalho de recuperação de desastres, é necessário realizar operações de restauração no site original e encerrar quaisquer operações de processamento do site sob o contrato de recuperação de desastres

18.5 Treinamento, Conscientização e Documentação

  • Os planos de recuperação de desastres devem ser totalmente documentados
  • Os DRPs devem ser tratados como documentos extremamente confidenciais e fornecidos aos indivíduos apenas com base na classificação e na necessidade de conhecimento

18.6 Teste e Manutenção

  • Todo plano de recuperação de desastres deve ser testado para garantir que as disposições do plano sejam viáveis ​​e atendam às necessidades de mudanças organizacionais.

18.6.1 Teste de leitura

  • O teste de leitura é o teste mais simples e importante e exige simplesmente que a equipe de recuperação de desastres distribua uma cópia da lista de verificação de recuperação de desastres

18.6.2 Exercícios estruturados

  • Os membros da equipe de recuperação de desastres se reúnem em uma grande sala de conferências, com pessoas diferentes desempenhando papéis diferentes quando ocorre um desastre** (Exercício de mesa)**

18.6.3 Teste de simulação

  • Os testes de simulação apresentam cenários aos membros da equipe de recuperação de desastres e exigem que eles gerem respostas apropriadas.Esses testes podem envolver a interrupção de atividades comerciais não críticas e o uso de determinado pessoal operacional.

18.6.4 Testes paralelos

  • Os testes paralelos representam o próximo nível de testes, redistribuindo o pessoal real para um local de recuperação alternativo e implementando medidas de capacitação do local. A única diferença é que as operações na instalação primária não são interrompidas e este local ainda lida com o processamento diário do organização.

18.6.5 Interromper completamente o teste

  • O teste de interrupção completo funciona de forma semelhante ao teste paralelo, mas envolve o encerramento das operações no site principal e sua movimentação para um site de recuperação

18.6.6 Manutenção

  • Os planos de recuperação de desastres são documentos flexíveis que devem ser modificados para atender às necessidades em constante mudança. O pessoal de recuperação de desastres deve usar o plano de continuidade de negócios da organização como modelo para os esforços de recuperação.

おすすめ

転載: blog.csdn.net/Runnymmede/article/details/133364301