Zabbix - Processo detalhado de monitoramento

# 一 、 Alterar senha e versão chinesa

Como um O&M com inglês ruim, ele foi discretamente alterado para a versão em chinês. Se você tem um bom inglês, pode ler a versão em inglês. Se o inglês não é bom, você pode alterá-lo. Afinal, a versão em chinês é mais adequada para iniciantes aprenderem mais rapidamente ~

[Falha na transferência da imagem da cadeia externa, a estação de origem pode ter um mecanismo de cadeia anti-roubo, é recomendável salvar a imagem e enviá-la diretamente (img-LkVTNhod-1585731121820) (https://upload-images.jianshu.io/upload_images/21294643-e195afc6a0af336f.png ? imageMogr2 / orientação automática / faixa% 7CimageView2 / 2 / w / 1240)]

image.png

Lembre-se de clicar na atualização abaixo após as alterações

# 2, crie um host e um grupo de hosts

  • Primeiro defina um grupo de hosts:
    image.png

image.png

  • Então você pode adicionar o host:
    image.png

image.png

  • Após a configuração, clique em Adicionar. Este host aparece na lista

# 三 、 Vigilância (itens)
### 1. Primeiro, crie três conjuntos de aplicativos

[Falha na transferência de imagem da cadeia externa, o site de origem pode ter um mecanismo de cadeia anti-roubo, é recomendável salvar a imagem e enviá-la diretamente (img-kRCzUQqH-1585731121821) ? imageMogr2 / orientação automática / faixa% 7CimageView2 / 2 / w / 1240)]

[Falha na transferência de imagem da cadeia externa, o site de origem pode ter um mecanismo de cadeia anti-roubo, é recomendável salvar a imagem e enviá-la diretamente (img-ika5yFwl-1585731121821) (https://upload-images.jianshu.io/upload_images/21294643-04148d4180728281.png ? imageMogr2 / orientação automática / faixa% 7CimageView2 / 2 / w / 1240)]

image.png

  • Ignore a criação de outros dois conjuntos de aplicativos
    image.png

2. Defina itens de monitoramento:

image.png

image.png

Para qualquer item monitorado, se você quiser ser monitorado, defina no lado do servidor zabbix que você pode se conectar ao lado do agente zabbix e obter comandos. Ou é definido no lado do agente para permitir que o lado do servidor obtenha comandos. Geralmente, esses são comandos internos e todos têm seus nomes, como os chamamos key.

A seguir, monitora a CPU interrompe por segundo

in Número de interrupções da CPU por segundo, incluindo interrupções de tempo
image.png

  • Em relação ao valor da chave, podemos configurá-lo diretamente na página da web (executada automaticamente pelo servidor) ou usar o comando da linha de comando (executado manualmente) para obter:
[root@zabbix-server zabbix]# zabbix_get -s 192.168.19.130 -p 10050 -k "system.cpu.intr"
1101429
  • No lado do agente, você também pode usar o comando para visualizar intra alteração da taxa: o
    image.png
    zabbix coletará dados históricos (todos os dados se tornam passados, O (∩_∩) O ha!), E também coletará dados médios por hora, como Os dados de tendências são coletados apenas uma vez a cada hora; portanto, os recursos usados ​​temporariamente pelas tendências são muito pequenos.

##### 2.1 Definir um item de monitoramento sem parâmetros

[Falha na transferência de imagem da cadeia externa, o site de origem pode ter um mecanismo de cadeia anti-roubo, é recomendável salvar a imagem e enviá-la diretamente (img-GFvii8iY-1585731121823) (https://upload-images.jianshu.io/upload_images/21294643-9876e81bef1be4e4.png ? imageMogr2 / orientação automática / faixa% 7CimageView2 / 2 / w / 1240)]

image.png

  • Após a configuração, clique em atualizar, ele irá automaticamente para a seguinte página:
    image.png

  • Após a conclusão da definição, retornamos a todos os hosts e aguardamos 5 segundos.Podemos ver que as opções por trás do nó node1 ficaram verdes: se não, lembre-se de atualizar
    image.png

  • Também podemos voltar ao nosso painel e podemos ver que um de nossos itens de monitoramento está ativado:
    image.png

image.png

  • Então, onde estão nossos dados? Você pode clicar 最新数据para adicionar nosso nó none1 ao host, aplicá-lo e pode ver o seguinte status:
    image.png

  • Como você pode ver, também temos uma página de gráficos, clique para ver a distribuição dos gráficos:
    image.png

  • De fato, existem muitos indicadores que nos preocupam e podemos adicioná-los um por um.

##### 2.2 Definir um item de monitoramento parametrizado com parâmetros

O item de monitoramento que acabamos de definir é muito simples, keyvocê pode especificar um , mas alguns itens de monitoramento estão com parâmetros, para que nossos itens de monitoramento tenham mais flexibilidade. A seguir, vamos explicar brevemente um item de monitoramento que requer parâmetros : a
image.png
imagem mostra o []significado dos parâmetros necessários, os valores internos são os parâmetros e as bandas <>não podem ser omitidas. Usamos este exemplo para ilustrar:
ifindica o nome da interface; <mode>indica qual modo, incluindo mas não limitado a: pacotes, bytes, erros e descarte (o acima pode ser passado ifconfigVer)

image.png

image.png

image.png

image.png

  • Da mesma forma, também podemos ver através da linha de comando:
[root@zabbix-server zabbix]# zabbix_get -s 192.168.19.130 -p 10050 -k "net.if.in[ens33,packets]"
36836
  • Vamos dar uma olhada na exibição da página da web:
    image.png

image.png

### 3. Defina rapidamente indicadores semelhantes

  • Se quisermos definir um indicador semelhante, podemos selecionar diretamente o clone e simplesmente modificar um pouco de parâmetros.
  • Tomando o net.if.in[ens33,packets]exemplo que acabamos de definir , se queremos definir um, podemos outfazer o seguinte:
    image.png

image.png

image.png

  • Se queremos defini-lo em bytes, faça o mesmo:
    image.png

  • Se necessário, o byte pode ser clonado. Não será demonstrado um por um ~

  • Você pode ver os indicadores que definimos agora:
    image.png

  • Chegamos à inspeção -> aos dados mais recentes, você pode ver que os itens de monitoramento que definimos já valem:
    image.png

### 4. Excluir itens

  • Se houver um item de monitoramento, não podemos usá-lo, podemos excluí-lo. Mas se você excluí-lo diretamente, os dados padrão serão deixados, portanto, precisamos limpar os dados primeiro e depois excluí-los.As etapas específicas são as seguintes:
  • Configuração-> Host-> Itens de Monitoramento-> Selecione um item de monitoramento desnecessário
    image.png

# 、 、 Trigger
### 1. Introdução

Quando nossos valores coletados são definidos, podemos definir o gatilho.
A definição de nosso gatilho é: definir o intervalo não razoável ou o estado não razoável dos dados coletados por um item específico. Geralmente uma expressão lógica.

Em geral, a maneira mais confiável de avaliar se o valor da amostragem está dentro de um intervalo razoável é determinar o resultado com base no valor médio dos últimos N tempos; esses últimos N tempos geralmente têm duas definições:

  1. A média dos resultados obtidos nos últimos N minutos
  2. A média dos últimos N resultados

Nota: Não use cadeias de caracteres se elas puderem ser salvas com valores numéricos

### 2. Expressão de gatilho

O formato básico da expressão do acionador é o seguinte:

{<server>:<key>.<function>(<parameter>)}<operator><constant>
  • server: Nome do host;
  • key: A chave do item de monitoramento correspondente do relacionamento no host;
  • function: A função usada para avaliar se os dados coletados estão dentro de um intervalo razoável.As funções atualmente suportadas pelo acionador são média (média), contagem (contagem), alteração (alteração), data (data), dia da semana (semana), delta (incremental), diff, iregexp, último (recente), max (valor máximo), min (valor mínimo), nodata (sem dados), agora (agora), soma (soma) etc.
  • parameter: Parâmetro de função; a maioria das funções numéricas pode aceitar o número de segundos como parâmetro e, se você usar "#" como prefixo antes do parâmetro numérico, significa o valor mais recente, como sum (300) significa tudo dentro de 300 segundos A soma dos valores e soma (# 10) significa a soma dos últimos 10 valores;

### 3. Defina um gatilho

Podemos observar rate of packets(in)o valor e usá-lo como padrão para determinar nosso valor anormal: na
image.png
figura, podemos ver que nosso valor máximo é 7, o valor mínimo é 4 e o valor médio é 4,59. Nesse caso, podemos definir que qualquer coisa acima de 5 é um valor anormal.

  • Vamos definir um gatilho abaixo:
    image.png
    Crie um gatilho no canto superior direito
    [A transferência de imagem da cadeia externa falhou, o site de origem pode ter um mecanismo de cadeia anti-roubo, é recomendável salvar a imagem e enviá-la diretamente (img-GUNLOgI4-1585731121829) (https: // upload- images.jianshu.io/upload_images/21294643-eff1b21ccf90f02f.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)]
    Após a conclusão da geração, clique em Adicionar na parte inferior da página e um gatilho será definido com êxito Ao mesmo tempo, a página salta automaticamente:
    image.png
  • Então vamos dar uma olhada no item que acabamos de definir o gatilho:
    image.png

Podemos ver que há uma linha nela, que é o valor que acabamos de definir, e a linha que excede a linha é o estado anormal, que parece muito intuitivo.
No entanto, agora, mesmo que essa linha seja excedida, ela gerará apenas um evento acionador e não fará mais nada. Portanto, precisamos definir uma ação.

# 五 、 ação definida (ação)
### 1. Introdução

Precisamos especificar o que fazer com base em um evento correspondente, que geralmente é executar um comando remoto ou enviar um alarme.

Primeiro, devemos definir um meio com antecedência e, segundo, também devemos definir o ponto final no qual o usuário recebe as mensagens (é claro, no usuário, também o chamamos de meio do usuário).

  • Podemos dar uma olhada nos tipos de mídia incorporados ao sistema:
    [Falha na transferência de imagem externa, o site de origem pode ter um mecanismo de cadeia anti-roubo, é recomendável salvar a imagem e enviá-la diretamente (img-Add7SDZy-1585731121830) (https: // upload-images .jianshu.io / upload_images / 21294643-146faa7d082213ab.png? imageMogr2 / orientação automática / faixa% 7CimageView2 / 2 / w / 1240)]

Esses são tipos de mídia grandes e há mais subdivisões. Vamos dar Emailum exemplo: o
image.png
mesmo, também podemos definir vários do mesmo tipo ou, por Emailexemplo, podemos definir um servidor Tencent, um NetEase Servidor, servidor Ali, etc.

### 2. Defina uma mídia

Ainda tomamos o Emailexemplo. Vamos simplesmente definir um meio:
image.png

  • A mídia está definida, então como podemos receber e-mails dos usuários? Por exemplo, vamos usuários de administrador para receber e-mail
    para a Administração -> Usuários -> Administração -> meios de alarme
    que adicionar um para vir:
    image.png
    depois de add é a seguinte:
    image.png
    Nós, em seguida, atualizá-lo.
    Um usuário pode adicionar vários tipos de mídia recebidos.

### 3. Defina uma ação

As ações são acionadas sob certas condições, por exemplo, se um acionador for acionado, ele acionará nossa ação.

  • Definimos uma ação baseada em redis. Primeiro, usamos o yum para instalar no lado do agente redis:
[root@zabbix-client ~]# yum -y install epel-release; yum -y install redis

Modifique o arquivo de configuração:

[root@zabbix-client ~]# vim /etc/redis.conf
bind 0.0.0.0        #不做任何认证操作

Após a conclusão da modificação, iniciamos o serviço e verificamos a porta:

[root@zabbix-client ~]# systemctl start redis
[root@zabbix-client ~]# netstat -lntp|grep redis
tcp        0      0 0.0.0.0:6379            0.0.0.0:*               LISTEN      2434/redis-server 0 

Em seguida, podemos ir ao site para definir as operações relevantes:

  • Crie um redisconjunto de aplicativos:
    image.png

##### 3.1 Definir itens de monitoramento

image.png

image.png
O item de monitoramento foi adicionado com sucesso.

  • Podemos verificar o seu valor:
    image.png

##### 3.2 Definir gatilho

Após definir os itens de monitoramento, também podemos definir um gatilho.Quando houver um problema com o serviço, podemos saber a tempo:

  • Configuração -> Host -> cliente zabbix -> Trigger -> Criar Trigger
    image.png

  • O gatilho foi adicionado com sucesso. Vamos dar uma olhada
    (Falha na transferência de imagem da cadeia externa, o site de origem pode ter um mecanismo de cadeia anti-roubo, é recomendável salvar a imagem e enviá-la diretamente (img-LvPsjmfl-1585731121831) (https://upload-images.jianshu.io/upload_images/21294643 -fbfd54c15ecef504.png? imageMogr2 / orientação automática / faixa% 7CimageView2 / 2 / w / 1240)]

  • Vamos desligar manualmente o serviço redis para verificar:

[root@zabbix-client ~]# systemctl stop redis

image.png

  • Como você pode ver, o problema agora é exibido. E por muito tempo, quando nosso serviço for aberto, ele será alterado para o estado resolvido:
[root@zabbix-client ~]# systemctl start redis

image.png

##### 3.3 Definir ação

[Falha na transferência de imagem da cadeia externa, o site de origem pode ter um mecanismo de cadeia anti-roubo, é recomendável salvar a imagem e enviá-la diretamente (img-rni74SqU-1585731121832) (https://upload-images.jianshu.io/upload_images/21294643-7994e10282815b77.png ? imageMogr2 / orientação automática / faixa% 7CimageView2 / 2 / w / 1240)]
[Transferência de imagem externa falhou, o site de origem pode ter um mecanismo de cadeia anti-roubo, é recomendável salvar a imagem e enviá-la diretamente (img-2xBFK2UL-1585731121832) : //upload-images.jianshu.io/upload_images/21294643-9f1bdc3b71d5f7b3.png? imageMogr2 / orientação automática / faixa% 7CimageView2 / 2 / w / 1240)]
image.png
image.png

  • Podemos ver que há duas operações que precisam ser executadas na máquina virtual: uma é modificar o arquivo de configuração sudo para permitir que o usuário do zabbix tenha temporariamente direitos de administrador; a outra é modificar o arquivo de configuração do zabbix para receber comandos remotos. Nós procedemos da seguinte forma:
[root@zabbix-client ~]# vim /etc/sudoers
## Allow root to run any commands anywhere 
root    ALL=(ALL)       ALL
zabbix  ALL=(ALL)       NOPASSWD:ALL     #添加此行

[root@zabbix-client ~]# vim /etc/zabbix/zabbix_agentd.conf
EnableRemoteCommands=1     #允许接收远程命令
LogRemoteCommands=1     #把接收的远程命令记入日志

[root@zabbix-client ~]# systemctl restart zabbix-agent
  • Nós adicionamos o que precisa ser feito na primeira etapa, que é reiniciar o serviço.E se a reinicialização não for bem-sucedida? Precisamos adicionar o segundo passo:
    image.png
    image.png
  • Após a conclusão da adição, podemos dar uma olhada:
    image.png
  • Após a adição da operação, se o serviço for restaurado automaticamente, podemos enviar uma mensagem para solicitar:
    image.png
  • Depois de adicionar, ele irá automaticamente para a seguinte página:
    image.png
  • Agora podemos parar manualmente o serviço para teste:
[root@zabbix-client ~]# systemctl stop redis
  • Chegamos à página do problema para verificar e descobrimos que havia realmente um problema e foi resolvido: Espere um pouco
    [Transferência de imagem de link externo falhou, o site de origem pode ter um mecanismo de cadeia anti-roubo, é recomendável salvar a imagem e enviá-la diretamente (img-bByvQ21x-1585731121834 ) (https://upload-images.jianshu.io/upload_images/21294643-87df2cfbe9740b3c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)]
    Você também pode ir para o lado do agente para ver se a porta está aberta:
[root@zabbix-client ~]# netstat -lntp|grep redis
tcp        0      0 0.0.0.0:6379            0.0.0.0:*               LISTEN      2744/redis-server 0 

#查看邮件是否发送成功
[root@zabbix-server ~]# yum -y install mailx
[root@zabbix-server ~]# mail
Heirloom Mail version 12.5 7/5/10.  Type ? for help.
"/var/spool/mail/root": 1 message 1 new
>N  1 [email protected]  Tue Mar 24 17:16  20/867   "Resolved: redis service down"
&

Pode-se ver que a porta é aberta normalmente e nosso gatilho de ação foi concluído.
Suplemento: também podemos usar scripts para enviar alertas.O caminho de armazenamento de nossos scripts pode ser encontrado no arquivo de configuração, definido como:AlterScriptsPath=/usr/lib/zabbix/alertscripts

  • Em seguida, desativaremos esta ação para se preparar para o alarme de email posterior.
    [Falha na transferência da imagem da cadeia externa, o site de origem pode ter um mecanismo de cadeia anti-roubo, é recomendável salvar a imagem e enviá-la diretamente (img-WHHhUse8-1585731121834) (https://upload-images.jianshu.io/upload_images/21294643-e43433bbbafcc61f.png ? imageMogr2 / orientação automática / faixa% 7CimageView2 / 2 / w / 1240)]
Publicado 92 artigos originais · Curtidas0 · Visitas 1425

Acho que você gosta

Origin blog.csdn.net/Forgetfanhua/article/details/105249849
Recomendado
Clasificación