Zabbix- Proceso detallado de monitoreo

# 一 、 Cambiar contraseña y versión china

Como un O&M con inglés pobre, se ha cambiado silenciosamente a la versión china. Si tienes un buen inglés, puedes leer la versión inglesa. Si el inglés no es bueno, puedes cambiarlo. Después de todo, la versión china es más adecuada para que los principiantes aprendan más rápido ~

[La transferencia de la imagen de la cadena externa falló, la estación fuente puede tener un mecanismo de cadena antirrobo, se recomienda guardar la imagen y cargarla directamente (img-LkVTNhod-1585731121820) (https://upload-images.jianshu.io/upload_images/21294643-e195afc6a0af336f.png ? imageMogr2 / auto-oriente / strip% 7CimageView2 / 2 / w / 1240)]

image.png

Recuerde hacer clic en actualizar a continuación después de los cambios

# 2, crea un host y un grupo de hosts

  • Primero defina un grupo de host:
    image.png

image.png

  • Luego puede agregar el host:
    image.png

image.png

  • Después de configurar, haga clic en Agregar. Este host aparece en la lista

# 三 、 Vigilancia (elementos)
### 1. Primero cree tres conjuntos de aplicaciones

[Falló la transferencia de la imagen de la cadena externa, el sitio de origen puede tener un mecanismo de cadena antirrobo, se recomienda guardar la imagen y cargarla directamente (img-kRCzUQqH-1585731121821) (https://upload-images.jianshu.io/upload_images/21294643-ecc44713889fdd4c.png ? imageMogr2 / auto-oriente / strip% 7CimageView2 / 2 / w / 1240)]

[Falló la transferencia de la imagen de la cadena externa, el sitio de origen puede tener un mecanismo de cadena antirrobo, se recomienda guardar la imagen y cargarla directamente (img-ika5yFwl-1585731121821) (https://upload-images.jianshu.io/upload_images/21294643-04148d4180728281.png ? imageMogr2 / auto-oriente / strip% 7CimageView2 / 2 / w / 1240)]

image.png

  • Omita la creación de otros dos conjuntos de aplicaciones
    image.png

### 2. Definir elementos de monitoreo:

image.png

image.png

Para cualquier elemento monitoreado, si desea poder ser monitoreado, debe definir en el lado del servidor zabbix que puede conectarse al lado del agente zabbix y poder obtener comandos. O se define en el lado del agente para permitir que el lado del servidor obtenga comandos. En general, estos son comandos integrados, y todos tienen sus nombres, que los llamamos key.

Lo siguiente monitorea las interrupciones de CPU por segundo

en el número de interrupciones por segundo CPU, incluyendo interrupción de tiempo
image.png

  • Con respecto al valor clave, podemos configurarlo directamente en la página web (ejecutado automáticamente por el servidor), o usar el comando de línea de comando (ejecutado manualmente) para obtener:
[root@zabbix-server zabbix]# zabbix_get -s 192.168.19.130 -p 10050 -k "system.cpu.intr"
1101429
  • En nuestro lado de agente, también puede usar comandos para ver intrel cambio de velocidad:
    image.png
    zabbix recopilará datos históricos (todos los datos se convierten en el pasado, O (∩_∩) O ha!), Y también recopilará datos promedio por hora Los datos de tendencias solo se recopilan una vez cada hora, por lo que los recursos utilizados temporalmente por las tendencias son muy pequeños.

##### 2.1 Definir un elemento de monitoreo sin parámetros

[Falló la transferencia de la imagen de la cadena externa, el sitio de origen puede tener un mecanismo de cadena antirrobo, se recomienda guardar la imagen y cargarla directamente (img-GFvii8iY-1585731121823) ? imageMogr2 / auto-oriente / strip% 7CimageView2 / 2 / w / 1240)]

image.png

  • Después de configurar, haga clic en actualizar, saltará automáticamente a la siguiente página:
    image.png

  • Una vez completada la definición, volvemos a todos los hosts y esperamos 5 segundos. Podemos ver que las opciones detrás de nuestro nodo node1 se han vuelto verdes: si no, recuerde actualizar
    image.png

  • También podemos volver a nuestro panel de control, y podemos ver que uno de nuestros elementos de monitoreo está habilitado:
    image.png

image.png

  • Entonces, ¿dónde están nuestros datos? Puede hacer clic 最新数据para agregar nuestro nodo none1 al host, aplicarlo y puede ver el siguiente estado:
    image.png

  • Como puede ver, también tenemos una página de gráficos, haga clic para ver la distribución de gráficos:
    image.png

  • De hecho, hay muchos indicadores que nos preocupan, y podemos agregarlos uno por uno.

##### 2.2 Definir un elemento de monitoreo parametrizado con parámetros

El elemento de monitoreo que acabamos de definir es muy simple, keypuede especificar uno , pero algunos elementos de monitoreo tienen parámetros, de modo que nuestros elementos de monitoreo tienen más flexibilidad. A continuación, expliquemos brevemente un elemento de monitoreo que requiere parámetros : la
image.png
imagen muestra el []significado de los parámetros requeridos, los valores dentro son los parámetros y las bandas <>no pueden omitirse. Utilizamos este ejemplo para ilustrar:
ifindica el nombre de la interfaz; <mode>indica qué modo, incluidos, entre otros: paquetes, bytes, errores y descartado (lo anterior se puede pasar ifconfigVer)

image.png

image.png

image.png

image.png

  • Del mismo modo, también podemos ver a través de la línea de comando:
[root@zabbix-server zabbix]# zabbix_get -s 192.168.19.130 -p 10050 -k "net.if.in[ens33,packets]"
36836
  • Echemos un vistazo a la visualización de la página web:
    image.png

image.png

### 3. Defina rápidamente indicadores similares

  • Si queremos definir un indicador similar, podemos seleccionar directamente el clon y luego simplemente modificar un poco de parámetros.
  • Tomando el net.if.in[ens33,packets]ejemplo que acabamos de definir , si queremos definir uno, podemos outhacer lo siguiente:
    image.png

image.png

image.png

  • Si queremos definirlo en bytes, haga lo mismo:
    image.png

  • Si es necesario, el byte se puede clonar. No se demostrará uno por uno ~

  • Puede ver los indicadores que hemos definido ahora:
    image.png

  • Llegamos a la inspección-> los últimos datos, puede ver que los elementos de monitoreo que hemos definido ya valen:
    image.png

### 4. Eliminar elementos

  • Si hay un elemento de monitoreo, no podemos usarlo, podemos eliminarlo. Pero si lo elimina directamente, se dejarán los datos predeterminados, por lo que primero tenemos que borrar los datos y luego eliminarlos. Los pasos específicos son los siguientes:
  • Configuración-> Host-> Elementos de monitorización-> Seleccione un elemento de monitorización innecesario
    image.png

# 四 、 trigger
### 1. Introducción

Cuando se definen nuestros valores recopilados, podemos definir el desencadenante.
La definición de nuestro desencadenante es: definir el intervalo no razonable o el estado no razonable de los datos recopilados por un elemento específico. Por lo general, una expresión lógica.

En general, la forma más confiable de evaluar si el valor de muestreo está dentro de un intervalo razonable es determinar el resultado en función del valor promedio de las últimas N veces; estas últimas N veces generalmente tienen dos definiciones:

  1. El promedio de los resultados obtenidos en los últimos N minutos.
  2. El promedio de los últimos N resultados

Nota: No use cadenas de caracteres si se pueden guardar con valores numéricos

### 2. Expresión de activación

El formato básico de expresión de activación es el siguiente:

{<server>:<key>.<function>(<parameter>)}<operator><constant>
  • server: Nombre de host;
  • key: La clave del elemento de supervisión correspondiente de la relación en el host;
  • function: La función utilizada para evaluar si los datos recopilados están dentro de un rango razonable. Las funciones que actualmente admite el desencadenador son avg (promedio), conteo (conteo), cambio (cambio), fecha (fecha), día de la semana (semana), delta (incremental), diff, iregexp, last (reciente), max (valor máximo), min (valor mínimo), nodata (sin datos), ahora (ahora), suma (suma), etc.
  • parameter: Parámetro de función; la mayoría de las funciones numéricas pueden aceptar el número de segundos como parámetro, y si usa "#" como prefijo antes del parámetro numérico, significa que el valor más reciente, como sum (300) significa todo dentro de 300 segundos La suma de los valores y suma (# 10) significa la suma de los últimos 10 valores;

### 3. Definir un disparador

Podemos ver rate of packets(in)el valor y usarlo como estándar para determinar nuestro valor anormal: en la
image.png
figura podemos ver que nuestro valor máximo es 7, el valor mínimo es 4 y el valor promedio es 4.59. En este caso, podemos definir que algo por encima de 5 es un valor anormal.

  • Definamos un disparador a continuación:
    image.png
    Cree un disparador en la esquina superior derecha
    [Error de transferencia de imagen de cadena externa, el sitio de origen puede tener un mecanismo de cadena antirrobo, se recomienda guardar la imagen y cargarla directamente (img-GUNLOgI4-1585731121829) (https: // upload- images.jianshu.io/upload_images/21294643-eff1b21ccf90f02f.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)]
    Después de completar la generación, hacemos clic en Agregar en la parte inferior de la página, y se define con éxito un desencadenante. Al mismo tiempo, la página salta automáticamente:
    image.png
  • Entonces echemos un vistazo al elemento que acabamos de definir el desencadenante:
    image.png

Podemos ver que hay una línea en él, que es el valor que acabamos de definir, y la línea que excede la línea es el estado anormal, que se ve muy intuitivo.
Sin embargo, ahora incluso si se supera esta línea, solo generará un evento desencadenante y no hará nada más. Por lo tanto, necesitamos definir una acción.

# 五 、 acción definida (acción)
### 1. Introducción

Necesitamos especificar qué hacer en función de un evento correspondiente, que generalmente es ejecutar un comando remoto o enviar una alarma.

Primero, debemos definir un medio de antemano, y segundo, también debemos definir el punto final en el que el usuario recibe mensajes (por supuesto, en el usuario, también lo llamamos el medio del usuario).

  • Podemos echar un vistazo a los tipos de medios integrados en el sistema:
    [Falló la transferencia de imagen externa, el sitio de origen puede tener un mecanismo de cadena antirrobo, se recomienda guardar la imagen y cargarla directamente (img-Add7SDZy-1585731121830) (https: // upload-images .jianshu.io / upload_images / 21294643-146faa7d082213ab.png? imageMogr2 / auto-orient / strip% 7CimageView2 / 2 / w / 1240)]

Estos son tipos de medios grandes y hay más subdivisiones. Tomemos Emailun ejemplo: lo
image.png
mismo, también podemos definir múltiples del mismo tipo o, por Emailejemplo, podemos definir un servidor Tencent, un NetEase Servidor, un servidor Ali, etc.

### 2. Definir un medio

Todavía tomamos el Emailejemplo. Simplemente definamos un medio:
image.png

  • Los medios están definidos, entonces, ¿cómo podemos recibir correos electrónicos de los usuarios? Por ejemplo, permita que nuestros usuarios administradores reciban correos electrónicos. Vaya
    a Administración -> Usuarios -> Administrador -> Medios de alarma.
    Agreguemos uno en:
    image.png
    después de agregarlo es así:
    image.png
    luego podemos actualizarlo.
    Un usuario puede agregar múltiples tipos de medios recibidos.

### 3. Definir una acción

Las acciones se activan bajo ciertas condiciones, por ejemplo, si se activa un activador, activará nuestra acción.

  • Definimos una acción basada en redis. Primero, usamos yum para instalar en el lado del agente redis:
[root@zabbix-client ~]# yum -y install epel-release; yum -y install redis

Modifique el archivo de configuración:

[root@zabbix-client ~]# vim /etc/redis.conf
bind 0.0.0.0        #不做任何认证操作

Una vez completada la modificación, comenzamos el servicio y verificamos el puerto:

[root@zabbix-client ~]# systemctl start redis
[root@zabbix-client ~]# netstat -lntp|grep redis
tcp        0      0 0.0.0.0:6379            0.0.0.0:*               LISTEN      2434/redis-server 0 

Luego, podemos ir al sitio web para definir las operaciones relevantes:

  • Crear un redisconjunto de aplicaciones:
    image.png

##### 3.1 Definir elementos de monitoreo

image.png

image.png
El elemento de supervisión se ha agregado correctamente.

  • Podemos verificar su valor:
    image.png

##### 3.2 Definir disparador

Después de definir los elementos de monitoreo, también podemos definir un desencadenante. Cuando hay un problema con el servicio, podemos saber a tiempo:

  • Configuración -> Host -> zabbix-client -> Trigger -> Create Trigger
    image.png

  • El disparador se ha agregado con éxito. Echemos un vistazo a
    (Falló la transferencia de imagen de cadena externa, el sitio de origen puede tener un mecanismo de cadena antirrobo, se recomienda guardar la imagen y subirla directamente (img-LvPsjmfl-1585731121831) (https://upload-images.jianshu.io/upload_images/21294643 -fbfd54c15ecef504.png? imageMogr2 / auto-orient / strip% 7CimageView2 / 2 / w / 1240)]

  • Apaguemos manualmente el servicio de redis para verificar:

[root@zabbix-client ~]# systemctl stop redis

image.png

  • Como puede ver, ahora se muestra el problema. Y durante mucho tiempo, cuando se abre nuestro servicio, se cambiará al estado resuelto:
[root@zabbix-client ~]# systemctl start redis

image.png

##### 3.3 Definir acción

[Falló la transferencia de la imagen de la cadena externa, el sitio de origen puede tener un mecanismo de cadena antirrobo, se recomienda guardar la imagen y cargarla directamente (img-rni74SqU-1585731121832) ? imageMogr2 / auto-orient / strip% 7CimageView2 / 2 / w / 1240)]
[La transferencia de imagen externa falló, el sitio de origen puede tener un mecanismo de cadena antirrobo, se recomienda guardar la imagen y cargarla directamente (img-2xBFK2UL-1585731121832) : //upload-images.jianshu.io/upload_images/21294643-9f1bdc3b71d5f7b3.png? imageMogr2 / auto-orient / strip% 7CimageView2 / 2 / w / 1240)]
image.png
image.png

  • Podemos ver que hay dos operaciones que deben realizarse en la máquina virtual: una es modificar el archivo de configuración de sudo para permitir que el usuario de zabbix tenga derechos de administrador temporalmente; la otra es modificar el archivo de configuración de zabbix para que pueda recibir comandos remotos. Procedemos de la siguiente manera:
[root@zabbix-client ~]# vim /etc/sudoers
## Allow root to run any commands anywhere 
root    ALL=(ALL)       ALL
zabbix  ALL=(ALL)       NOPASSWD:ALL     #添加此行

[root@zabbix-client ~]# vim /etc/zabbix/zabbix_agentd.conf
EnableRemoteCommands=1     #允许接收远程命令
LogRemoteCommands=1     #把接收的远程命令记入日志

[root@zabbix-client ~]# systemctl restart zabbix-agent
  • Hemos agregado lo que debe hacerse en el primer paso, que es reiniciar el servicio. ¿Qué sucede si el reinicio no es exitoso? Necesitamos agregar el segundo paso:
    image.png
    image.png
  • Una vez completada la adición, podemos echar un vistazo:
    image.png
  • Después de agregar la operación, si el servicio se restaura automáticamente, podemos enviar un mensaje para solicitar:
    image.png
  • Después de agregar, saltará automáticamente a la siguiente página:
    image.png
  • Ahora podemos detener manualmente el servicio para probar:
[root@zabbix-client ~]# systemctl stop redis
  • Luego llegamos a la página del problema para verificar y descubrimos que efectivamente había un problema y que se había resuelto: Espere un momento
    [La transferencia de la imagen del enlace externo falló, el sitio de origen puede tener un mecanismo de cadena antirrobo, se recomienda guardar la imagen y cargarla directamente (img-bByvQ21x-1585731121834 ) (https://upload-images.jianshu.io/upload_images/21294643-87df2cfbe9740b3c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)]
    También puede ir al lado del agente para ver si el puerto está abierto:
[root@zabbix-client ~]# netstat -lntp|grep redis
tcp        0      0 0.0.0.0:6379            0.0.0.0:*               LISTEN      2744/redis-server 0 

#查看邮件是否发送成功
[root@zabbix-server ~]# yum -y install mailx
[root@zabbix-server ~]# mail
Heirloom Mail version 12.5 7/5/10.  Type ? for help.
"/var/spool/mail/root": 1 message 1 new
>N  1 [email protected]  Tue Mar 24 17:16  20/867   "Resolved: redis service down"
&

Se puede ver que el puerto se abre normalmente y nuestro desencadenador de acción se ha completado.
Suplemento: También podemos usar scripts para enviar alertas. La ruta de almacenamiento de nuestros scripts se puede encontrar en el archivo de configuración, definido como:AlterScriptsPath=/usr/lib/zabbix/alertscripts

  • Luego, desactivaremos esta acción para prepararnos para la posterior alarma de correo.
    [Falló la transferencia de la imagen del enlace externo, el sitio de origen puede tener un mecanismo de cadena antirrobo, se recomienda guardar la imagen y cargarla directamente (img-WHHhUse8-1585731121834) ? imageMogr2 / auto-oriente / strip% 7CimageView2 / 2 / w / 1240)]
92 artículos originales publicados · Me gusta0 · Visitas 1425

Supongo que te gusta

Origin blog.csdn.net/Forgetfanhua/article/details/105249849
Recomendado
Clasificación