Monitoreo de la memoria del servidor de monitoreo Prometheus

Monitoreo de la memoria del servidor de monitoreo Prometheus

fenómeno inusual

El centos7 monitoreado usa el node_exporter1.6 de Prometheus2.5 para recibir siempre la información de alarma de WeChat de la siguiente manera:

Luego inicie sesión en el servidor para consultar, ejecute el comando free -m, y la información es la siguiente:

Encontrada: la información de alarma es inconsistente con la información real del servidor;

Proceso

Fórmula de consulta PromQL:

ceil(100 - (((node_memory_MemFree_bytes{
    
    job="gtcq-gt-devops-node-exporter"} + node_memory_Buffers_bytes{
    
    job="gtcq-gt-devops-node-exporter"} + node_memory_Cached_bytes{
    
    job="gtcq-gt-devops-node-exporter"}) / node_memory_MemTotal_bytes{
    
    job="gtcq-gt-devops-node-exporter"}) * 100)) > 90

Nota: Después de la verificación, la fórmula PromQL anterior no es aplicable a centos7, y esta verificación de fórmula es aplicable a centos6;

Modifica la fórmula

Modifique la fórmula de la siguiente manera, consulte la fórmula de PromQL:

ceil((1 - (node_memory_MemAvailable_bytes{
    
    job="gtcq-gt-devops-node-exporter"} / (node_memory_MemTotal_bytes{
    
    job="gtcq-gt-devops-node-exporter"}))) * 100) >90 

Nota: Esta fórmula todavía es algo diferente de los datos reales del servidor, pero está cerca Espero que haya una fórmula de monitoreo más precisa para dejar un mensaje;

Supongo que te gusta

Origin blog.csdn.net/qq_31555951/article/details/109068097
Recomendado
Clasificación