Instale o gerenciador de alertas

1. Faça o download do pacote de instalação

https://prometheus.io/download/

 

2. Carregue e descompacte

-rwxr-xr-x. 1 3434 3434 26971621 Dez 11 22:13 alertmanager 
-rw-r - r--. 1 3434 3434 380 11 de dezembro 22:51 alertmanager.yml 
-rwxr-xr-x. 1 3434 3434 22458246 Dez 11 22:14 amtool 
-rw-r - r--. 1 3434 3434 11357 Dez 11 22:51 LICENÇA 
-rw-r - r--. 1 3434 3434 457 Dez 11 22:51 AVISO

 

3. Modifique o arquivo de configuração alertmanager.yml

vim alertmanager.yml

global: 
  resolve_timeout: 5m 
  smtp_smarthost: 'smtp.163.com:25' 
  smtp_from: '[email protected]' 
  smtp_auth_password: 'xxx' 
  smtp_require_tls: false 
  smtp_auth_username: '[email protected]' 


route: 
  group_by ] 
  group_wait: 10s 
  group_interval: 10s 
  repeat_interval: 2m # Intervalo de tempo de dois alarmes idênticos 
  receptor: 'email' # receptor 

receptores: 
  -name: 
'email' # Para ser consistente com o valor do receptor na rota email_configs: # O site oficial fornece Este item de configuração 
  -para: '[email protected]' # destinatário do email 

#inhibit_rules: 
# -source_match: 
# severity: 'critical' 
# target_match:
# severity: 'warning' 
# equal: ['alertname', 'dev', 'instance']

 

4. Inicie o serviço alertmanager

./alertmanager --config.file = alertmanager.yml

 

5. Modifique prometheus.yml, configure a comunicação com o alertmanager

# Alertmanager da configuração alertman 
: 
  alertmanagers: 
  - static_configs: 
    - 
       target : - 127.0.0.1:9093 # 与 与 alertmanager 通信 通信

# Carrega regras uma vez e periodicamente as avalie de acordo com o global 'assessment_interval'. 
rule_files: 
   - "rules / node_rules.yml" # 配置 告警 规则

 

6. Configure regras de alarme

regras do vim / node_rule.yml

groups: 
-name: 
  Regras gerais de monitoramento da instância : 
  -alert: instância DOWN 
    expr: up == 0 
    para: 1m # Se dentro de 1m, a instância estiver totalmente ativa == 0, ele irá alarmar os 
    rótulos: 
      gravidade: 
    anotações de erro : 
      descrição : '{{$ labels.instance}} do trabalho {{$ labels.job}} trava por mais de um minuto.' 
      resumo: 'Exemplo: {{$ labels.instance}} está morto, manuseie ...'

 

7. Efetue a configuração do prometheus eficaz

kill -hup pid

 

8. Verificação

Acho que você gosta

Origin www.cnblogs.com/z-qinfeng/p/12748240.html
Recomendado
Clasificación