La última versión de las preguntas de la entrevista de operación y mantenimiento de Linux en 2023 (3)

  • Sobre el autor: Un personal de operación y mantenimiento de redes de computación en la nube, que comparte tecnología de red y operación y mantenimiento e información útil todos los días. 

  • Cuenta pública: Escuela de Computación en la Nube Netdou

  •  Lema: Mantén la cabeza gacha y sé respetuoso.

  • Página de inicio personal:  página de inicio de Internet Bean

Tabla de contenido

escribir delante

 16. ¿Qué es keepalived?

 17. ¿Cómo entiendes el protocolo VRRP?

18. ¿Cómo funciona keepalived?

19. Causas del cerebro dividido

 20. ¿Cómo resolver el problema del cerebro dividido keepalived?


escribir delante

    Hola a todos, soy Wangdou, un blogger especializado en el campo de operación y mantenimiento. Hoy les traigo un tema especial: preguntas de la entrevista de operación y mantenimiento. Hoy en día, a medida que la industria de TI continúa desarrollándose, las entrevistas para puestos de operaciones y mantenimiento ya no se limitan al examen de conocimientos básicos, sino que prestan más atención a la experiencia práctica, la capacidad de resolución de problemas y la actitud hacia el aprendizaje continuo de los candidatos. Por lo tanto, este artículo compartirá con usted algunas preguntas comunes de las entrevistas de operación y mantenimiento para ayudarlo a prepararse mejor para las entrevistas y mejorar su competitividad.

Con la popularización de la computación en la nube, big data y otras tecnologías, los puestos de operación y mantenimiento se están volviendo cada vez más importantes en el campo de TI. Un excelente ingeniero de operación y mantenimiento no solo debe tener una base técnica sólida, sino que también debe tener buenas habilidades para la resolución de problemas, espíritu de trabajo en equipo y capacidad de aprendizaje. Por lo tanto, la entrevista es un paso clave en la selección de excelentes ingenieros de operación y mantenimiento.

Durante el proceso de entrevista, el entrevistador suele examinar aspectos como los conocimientos básicos, la experiencia práctica, el trabajo en equipo y la capacidad de aprendizaje. A continuación, presentaré las preguntas de la entrevista en estos aspectos una por una y daré las ideas y técnicas de respuesta correspondientes. Espero que este artículo pueda ayudarlo a prepararse mejor para la entrevista de operación y mantenimiento y obtener su puesto favorito.

Tenga en cuenta que estas preguntas son solo una de las preguntas comunes de las entrevistas y es posible que se cubran otros aspectos en la entrevista real. Por lo tanto, se recomienda que al prepararse para las entrevistas, además de dominar estas preguntas, también se concentre en mejorar integralmente sus capacidades técnicas y la calidad general.
 


 16. ¿Qué es keepalived?

 En términos generales, se trata de alta disponibilidad y, en sentido estricto, de redundancia y gestión del host.

 Keepalived fue diseñado originalmente para LVS y se utiliza específicamente para monitorear el estado de cada nodo de servicio en el sistema de clúster. Detecta el estado de cada nodo de servicio en función de los mecanismos de conmutación de tercera, cuarta y quinta capa del modelo de referencia TCP/IP. Si un determinado nodo del servidor es anormal o el trabajo falla, Keepalived lo detectará y eliminará el nodo del servidor fallido del sistema del clúster. Todas estas tareas se completan automáticamente y no requieren intervención manual. Todo lo que se debe hacer manualmente es la reparación. Un nodo de servicio fallido.

Más tarde, Keepalived agregó la función VRRP. El propósito de VRRP (VritrualRouterRedundancyProtocol, protocolo de redundancia de enrutamiento virtual) es resolver el problema del punto único de falla en el enrutamiento estático. A través de VRRP, se puede lograr un funcionamiento ininterrumpido y estable de la red, por lo que Keepalived tiene el estado del servidor por un lado y las funciones de detección y aislamiento de fallas, por otro lado, también existen funciones de HAcluster.

Por lo tanto, la función principal de keepalived es la verificación del estado y el reemplazo de fallas.
La llamada verificación de estado utiliza protocolo de enlace de tres vías TCP, solicitud ICMP, solicitud HTTP, solicitud de eco UDP, etc. para mantener vivo el servidor real detrás del equilibrador de carga (generalmente el servidor que realiza el negocio real);

 La conmutación por error se aplica principalmente a los balanceadores de carga configurados con los modos activo y en espera. VRRP se utiliza para mantener el latido de los balanceadores de carga activos y en espera. Cuando hay un problema con el balanceador de carga activo, el balanceador de carga en espera lleva los servicios correspondientes, por lo tanto Maximizar la eficiencia del balanceador de carga. Reducir la pérdida de tráfico y proporcionar estabilidad del servicio.


 17. ¿Cómo entiendes el protocolo VRRP?

¿Por qué utilizar VRRP?

La comunicación entre hosts se completa configurando el enrutamiento estático o (puerta de enlace predeterminada). Una vez que el enrutador entre hosts falla, la comunicación fallará. Por lo tanto, en este modo de comunicación, el enrutador se convierte en un cuello de botella de un solo punto. Para resolver este problema, el Se introdujo el protocolo VRRP.


El protocolo VRRP es un protocolo de modo maestro de respaldo tolerante a fallas que garantiza que cuando falla la ruta del siguiente salto de un host, otro enrutador se hará cargo del trabajo del enrutador fallido. VRRP se puede utilizar de forma transparente cuando ocurre una falla en la red. Cambio de dispositivo sin afectar la comunicación de datos entre hosts.

 Tres estados de VRRP:
El enrutador VRRP tiene tres estados durante la operación:
1. Estado de inicialización: después de que se inicia el sistema, ingresa a Inicializar. En este estado, el enrutador no realiza ningún procesamiento de mensajes VRRP;
2. Estado maestro;
3. Copia de seguridad estado;
Generalmente, el enrutador principal está en el estado Maestro y el enrutador de respaldo está en el estado de Respaldo.


18. ¿Cómo funciona keepalived?

keepalived adopta un diseño modular y diferentes módulos implementan diferentes funciones.
keepalived tiene principalmente tres módulos, a saber, core, check y vrrp.
core: es el núcleo de keepalived, responsable del inicio y mantenimiento del proceso principal, la carga y análisis de archivos de configuración global, etc.
check: responsable de Healthchecker (verificación de salud), incluidos varios métodos de verificación de salud y el análisis de configuraciones correspondientes, incluido el análisis de configuración LVS; puede verificar el estado de salud del servidor backend IPVS según la verificación del script

vrrp: subproceso VRRPD. El subproceso VRRPD se utiliza para implementar el
par de alta disponibilidad Keepalived del protocolo VRRP. La comunicación entre los pares de alta disponibilidad Keepalived se realiza a través de VRRP. VRRP determina el maestro y el respaldo a través del mecanismo de elección. El maestro tiene una prioridad más alta que la copia de seguridad. Por lo tanto, el trabajo El nodo primario obtendrá todos los recursos primero y el nodo en espera está en estado de espera. Cuando el nodo primario cae, el nodo en espera se hará cargo de los recursos de el nodo primario y luego reemplazar el nodo primario para proporcionar servicios externos.

Entre los pares de servicios Keepalived, solo el servidor maestro siempre enviará paquetes de transmisión VRRP para decirle al servidor de respaldo que está activo. En este momento, el servidor de respaldo no se apropiará del maestro. Cuando el maestro no está disponible, es decir, cuando el servidor de respaldo El servidor no puede escuchar los paquetes de transmisión enviados por el maestro, se iniciarán los servicios relevantes para hacerse cargo de los recursos para garantizar la continuidad del negocio y la velocidad de adquisición es la más rápida.


19. Causas del cerebro dividido

¿Qué es el cerebro dividido?

En un sistema de alta disponibilidad (HA), cuando se desconecta la "línea de latido" que conecta dos nodos, el sistema HA, que originalmente era un conjunto y acciones coordinadas, se
divide en dos entidades independientes.
Desde que perdieron contacto entre sí, ambos pensaron que la otra parte había fallado. El software HA en los dos nodos es como un "hombre con el cerebro dividido", que compite por "
recursos compartidos" y "servicios de aplicaciones", lo que tendrá graves consecuencias. Los recursos compartidos se dividen y los "servicios" de ambos lados no se pueden iniciar, o
los "servicios" de ambos lados están activos, pero el "almacenamiento compartido" se lee y escribe al mismo tiempo, lo que provoca daños en los datos.

¿Cuáles son las causas del cerebro dividido?

El enlace de latido entre el par de servidores de alta disponibilidad falló, lo que provocó una falla en la comunicación normal.
Porque el cable de los latidos del corazón está roto (incluso roto o envejecido).
Debido a que la tarjeta de red y los controladores relacionados están rotos, configuración de IP y problemas de conflicto (conexión directa de la tarjeta de red),
debido a fallas del dispositivo (tarjeta de red y conmutador) conectados entre las líneas de latido,
debido a problemas con la máquina arbitrada (se adopta una solución de arbitraje ),
iptables está habilitado en el servidor de alta disponibilidad. El firewall bloquea la transmisión de mensajes de latido.
Información como la dirección de la tarjeta de red de latidos en el servidor de alta disponibilidad está configurada incorrectamente, lo que provoca que no se envíen los latidos.
Otras razones incluyen la configuración incorrecta de otros servicios, como diferentes modos de latido, conflictos de inserción de latidos amplios, errores de software, etc.


 20. ¿Cómo resolver el problema del cerebro dividido keepalived?

En entornos de producción reales, evitamos la división del cerebro en los siguientes aspectos:

Use un cable serial y un cable Ethernet para conectarse al mismo tiempo y use dos líneas de latido al mismo tiempo. De esta manera, si una línea está rota, la otra aún está en
buen estado y el mensaje de latido aún se puede transmitir.

Al verificar si hay cerebro dividido, apagar por la fuerza un nodo de latido (esta función requiere soporte de equipo especial, como stonith y valla) es equivalente a que el nodo de respaldo
no reciba el mensaje de latido y envíe un comando de apagado a través de una línea separada para apagar. el poder del nodo maestro.


Haga un buen trabajo de monitoreo y alarmas para soluciones comunes de cerebro dividido :

Si el firewall está activado, se debe permitir el paso de mensajes de latido, lo que generalmente se resuelve permitiendo segmentos de IP.

Puede conectar un cable Ethernet o un cable de puerto serie como una línea de latido redundante para los nodos primario y secundario.

Desarrollar un programa de detección para detectar cerebros divididos mediante software de monitoreo


 

Supongo que te gusta

Origin blog.csdn.net/yj11290301/article/details/135213608
Recomendado
Clasificación