Monitoreo de la memoria del servidor de monitoreo Prometheus
fenómeno inusual
El centos7 monitoreado usa el node_exporter1.6 de Prometheus2.5 para recibir siempre la información de alarma de WeChat de la siguiente manera:
Luego inicie sesión en el servidor para consultar, ejecute el comando free -m, y la información es la siguiente:
Encontrada: la información de alarma es inconsistente con la información real del servidor;
Proceso
Fórmula de consulta PromQL:
ceil(100 - (((node_memory_MemFree_bytes{
job="gtcq-gt-devops-node-exporter"} + node_memory_Buffers_bytes{
job="gtcq-gt-devops-node-exporter"} + node_memory_Cached_bytes{
job="gtcq-gt-devops-node-exporter"}) / node_memory_MemTotal_bytes{
job="gtcq-gt-devops-node-exporter"}) * 100)) > 90
Nota: Después de la verificación, la fórmula PromQL anterior no es aplicable a centos7, y esta verificación de fórmula es aplicable a centos6;
Modifica la fórmula
Modifique la fórmula de la siguiente manera, consulte la fórmula de PromQL:
ceil((1 - (node_memory_MemAvailable_bytes{
job="gtcq-gt-devops-node-exporter"} / (node_memory_MemTotal_bytes{
job="gtcq-gt-devops-node-exporter"}))) * 100) >90
Nota: Esta fórmula todavía es algo diferente de los datos reales del servidor, pero está cerca Espero que haya una fórmula de monitoreo más precisa para dejar un mensaje;