A versão mais recente das perguntas da entrevista sobre operação e manutenção do Linux em 2023 (3)

  • Sobre o autor: Uma equipe de operação e manutenção de rede de computação em nuvem, compartilhando tecnologia de rede, operação e manutenção e informações úteis todos os dias. 

  • Conta pública: Netdou Cloud Computing School

  •  Lema: Mantenha a cabeça baixa e seja respeitoso

  • Página inicial pessoal:  página inicial do Internet Bean

Índice

escreva na frente

 16. O que é keepalive?

 17. Como você entende o protocolo VRRP?

18. Como funciona o keepalived?

19. Causas de divisão cerebral

 20. Como resolver o problema do cérebro dividido de manutenção de atividade?


escreva na frente

    Olá a todos, sou Wangdou, um blogueiro com foco na área de operação e manutenção. Hoje trago para vocês um tema especial: perguntas da entrevista de operação e manutenção. Hoje, à medida que a indústria de TI continua a se desenvolver, as entrevistas para cargos de operações e manutenção não se limitam mais ao exame de conhecimentos básicos, mas prestam mais atenção à experiência prática, às habilidades de resolução de problemas e à atitude em relação ao aprendizado contínuo dos candidatos. Portanto, este artigo compartilhará com você algumas perguntas comuns em entrevistas de operação e manutenção para ajudá-lo a se preparar melhor para as entrevistas e melhorar sua competitividade.

Com a popularização da computação em nuvem, big data e outras tecnologias, os cargos de operação e manutenção estão se tornando cada vez mais importantes na área de TI. Um excelente engenheiro de operação e manutenção não deve apenas ter uma base técnica sólida, mas também ter boas habilidades de resolução de problemas, espírito de trabalho em equipe e capacidade de aprendizagem. Portanto, a entrevista é uma etapa fundamental na seleção de excelentes engenheiros de operação e manutenção.

Durante o processo de entrevista, o entrevistador geralmente examina aspectos como conhecimentos básicos, experiência prática, trabalho em equipe e capacidade de aprendizagem. A seguir, apresentarei as perguntas da entrevista nesses aspectos, uma por uma, e darei ideias e técnicas de resposta correspondentes. Espero que este artigo possa ajudá-lo a se preparar melhor para a entrevista de operação e manutenção e a conseguir sua posição preferida.

Observe que essas perguntas são apenas uma das perguntas comuns da entrevista e outros aspectos podem ser abordados na entrevista real. Portanto, é recomendável que, ao se preparar para entrevistas, além de dominar essas questões, você também se concentre em melhorar de forma abrangente suas capacidades técnicas e qualidade geral.
 


 16. O que é keepalive?

 Em termos gerais, é alta disponibilidade e, em sentido restrito, é redundância e gerenciamento de host.

 Keepalived foi originalmente projetado para LVS, usado especificamente para monitorar o status de cada nó de serviço no sistema de cluster.Ele detecta o status de cada nó de serviço com base nos mecanismos de comutação de terceira, quarta e quinta camadas do modelo de referência TCP/IP. Se um determinado nó do servidor estiver anormal ou o trabalho falhar, o Keepalived irá detectá-lo e remover o nó do servidor com falha do sistema de cluster. Todas essas tarefas são concluídas automaticamente e não requerem intervenção manual. Tudo o que precisa ser feito manualmente é reparar • Um nó de serviço com falha.

Mais tarde, Keepalived adicionou a função VRRP. O objetivo do VRRP (VritrualRouterRedundancyProtocol, protocolo de redundância de roteamento virtual) é resolver o problema de ponto único de falha no roteamento estático. Através do VRRP, a operação ininterrupta e estável da rede pode ser alcançada, então Keepalived tem por um lado, o status do servidor e as funções de detecção e isolamento de falhas, por outro lado, também existem funções do HAcluster.

Portanto, a função central do keepalived é a verificação de integridade e a substituição de falhas.
A chamada verificação de integridade usa handshake TCP de três vias, solicitação ICMP, solicitação HTTP, solicitação de eco UDP, etc. para manter ativo o servidor real por trás do balanceador de carga (geralmente o servidor que realiza o negócio real);

 O failover é aplicado principalmente a balanceadores de carga configurados com modos ativo e de espera. O VRRP é usado para manter a pulsação dos balanceadores de carga ativos e de espera. Quando há um problema com o balanceador de carga ativo, o balanceador de carga de espera transporta os serviços correspondentes, portanto maximizando a eficiência do balanceador de carga. Reduzindo a perda de tráfego e fornecendo estabilidade de serviço


 17. Como você entende o protocolo VRRP?

Por que usar VRRP?

A comunicação entre os hosts é concluída configurando o roteamento estático ou (gateway padrão). Quando o roteador entre os hosts falhar, a comunicação falhará. Portanto, neste modo de comunicação, o roteador se torna um gargalo de ponto único. ,Para resolver esse problema, o O protocolo VRRP foi introduzido.


O protocolo VRRP é um protocolo de modo de backup mestre tolerante a falhas que garante que quando a rota do próximo salto de um host falhar, outro roteador assumirá o trabalho do roteador com falha. O VRRP pode ser usado de forma transparente quando ocorre uma falha na rede. Troca de dispositivos sem afetar a comunicação de dados entre hosts.

 Três estados do VRRP:
O roteador VRRP possui três estados durante a operação:
1. Estado de inicialização: Após o sistema iniciar, ele entra em Inicializar. Neste estado, o roteador não faz nenhum processamento de mensagens VRRP;
2. Estado mestre;
3. Backup estado;
Geralmente, o roteador principal está no estado Master e o roteador de backup está no estado Backup.


18. Como funciona o keepalived?

keepalived adota um design modular e diferentes módulos implementam funções diferentes.
keepalived possui principalmente três módulos, nomeadamente core, check e vrrp.
núcleo: é o núcleo do keepalived, responsável pela inicialização e manutenção do processo principal, pelo carregamento e análise de arquivos de configuração globais, etc.
check: responsável pelo healthchecker (verificação de saúde), incluindo vários métodos de verificação de saúde, e a análise de configurações correspondentes, incluindo análise de configuração LVS;Pode verificar o status de integridade do servidor backend IPVS com base na verificação de script

vrrp: Subprocesso VRRPD. O subprocesso VRRPD é usado para implementar o
par de alta disponibilidade Keepalived do protocolo VRRP. A comunicação entre os pares de alta disponibilidade Keepalived é através do VRRP. VRRP determina o mestre e o backup através do mecanismo de eleição . O mestre tem uma prioridade mais alta que o backup. Portanto, o trabalho O nó primário obterá todos os recursos primeiro, e o nó de espera estará em estado de espera. Quando o nó primário ficar inativo, o nó de espera assumirá os recursos de o nó primário e, em seguida, substitua o nó primário para fornecer serviços externos.

Entre pares de serviços Keepalived, apenas o servidor mestre sempre enviará pacotes de transmissão VRRP para informar ao servidor de backup que ele está ativo. Neste momento, o servidor de backup não irá antecipar o mestre. Quando o mestre estiver indisponível, ou seja, quando o backup O servidor não pode ouvir os pacotes de transmissão enviados pelo mestre, ele irá Os serviços relevantes serão iniciados para assumir o controle dos recursos para garantir a continuidade dos negócios. A velocidade de controle é a mais rápida.


19. Causas de divisão cerebral

O que é cérebro dividido?

Em um sistema de alta disponibilidade (HA), quando a "linha de pulsação" que conecta dois nós é desconectada, o sistema HA, que originalmente era um todo e ações coordenadas, se
divide em duas entidades independentes.
Como perderam contato um com o outro, ambos pensaram que a outra parte estava com defeito. O software HA nos dois nós é como um “homem com cérebro dividido”, competindo por “
recursos compartilhados” e “serviços de aplicação”, o que levará a sérias consequências. Os recursos compartilhados estão divididos e os “serviços” de ambos os lados não podem ser iniciados; ou
os “serviços” de ambos os lados estão ativos, mas o “armazenamento compartilhado” é lido e gravado ao mesmo tempo, resultando em danos aos dados.

Quais são as causas do cérebro dividido?

O link de pulsação entre o par de servidores de alta disponibilidade falhou, resultando na falha da comunicação normal.
Porque o cabo de batimento cardíaco está quebrado (inclusive quebrado ou envelhecido).
Como a placa de rede e os drivers relacionados estão quebrados, problemas de configuração e conflito de IP (conexão direta da placa de rede),
devido a falha do dispositivo (placa de rede e switch) conectado entre as linhas de pulsação,
devido a problemas com a máquina arbitrada (solução de arbitragem é adotada ),
o iptables está habilitado no servidor de alta disponibilidade. O firewall bloqueia a transmissão de mensagens de pulsação.
Informações como o endereço da placa de rede de pulsação no servidor de alta disponibilidade estão configuradas incorretamente, resultando em falha no envio de pulsações.Outras
razões incluem configuração inadequada de outros serviços, como diferentes modos de pulsação, conflitos de inserção em toda a pulsação, bugs de software, etc.


 20. Como resolver o problema do cérebro dividido de manutenção de atividade?

Em ambientes de produção reais, evitamos a divisão do cérebro nos seguintes aspectos:

Use um cabo serial e um cabo Ethernet para conectar ao mesmo tempo e use duas linhas de pulsação ao mesmo tempo. Desta forma, se uma linha estiver quebrada, a outra ainda estará
boa e a mensagem de pulsação ainda poderá ser transmitida.

Ao verificar se há split-brain, o desligamento forçado de um nó de pulsação (esta função requer suporte de equipamento especial, como stonith e fence) é equivalente ao nó de backup
não receber a mensagem de pulsação e enviar um comando de desligamento por meio de uma linha separada para desligar o poder do nó mestre.


Faça um bom trabalho de monitoramento e alarme para soluções comuns de cérebro dividido :

Se o firewall estiver ativado, as mensagens de pulsação deverão poder passar. Isso geralmente é resolvido permitindo segmentos IP.

Você pode puxar um cabo Ethernet ou um cabo de porta serial como uma linha de pulsação redundante para os nós primários e secundários.

Desenvolva um programa de detecção para detectar cérebro dividido por meio de software de monitoramento


 

Acho que você gosta

Origin blog.csdn.net/yj11290301/article/details/135213608
Recomendado
Clasificación