node_exporter监控指标

1、Node_exporter监控agent存活

PromQL语句:

up{job="捷顺监控"} == 0

说明:检测Node_exporter监控agent是否存活、或者是Node_exporter服务是否挂掉

2、Node_exporter监控CPU利用率

PromQL语句:

ceil(100 - sum(increase(node_cpu_seconds_total{job="捷顺监控",mode="idle"}[5m]))  by(instance) / sum(increase(node_cpu_seconds_total{job="捷顺监控"}[5m]))  by(instance)*100) >= 80

说明:监控服务器的CPU利用率,如果大于80%就告警

3、Node_exporter监控磁盘利用率

PromQL语句:

round((1 - (node_filesystem_avail_bytes{fstype=~"ext3|ext4|xfs|nfs",job="捷顺监控"} / node_filesystem_size_bytes{fstype=~"ext3|ext4|xfs|nfs",job="捷顺监控"})) * 100)  >= 80

说明:监控服务器的磁盘利用率,如果大于80%就告警

4、Node_exporter监控内存利用率

PromQL语句:

ceil((1 - (node_memory_MemAvailable_bytes{job="捷顺监控"} / (node_memory_MemTotal_bytes{job="捷顺监控"})))* 100 ) >= 80

说明:监控服务器的内存利用率,如果大于80%就告警

5、Node_exporter监控服务器负载情况

PromQL语句:

node_load1{job="捷顺监控"} >=50

说明:监控服务器的服务器负载情况,如果大于50就告警

6、Node_exporter监控服务器文件句柄使用

PromQL语句:

node_filefd_allocated{job="捷顺监控"} >=50000

说明:监控服务器的文件句柄使用情况,如果大于50000就告警

7、Node_exporter监控服务器等待关闭的TCP连接数

PromQL语句:

node_sockstat_TCP_tw{job="捷顺监控"} >=5000

说明:监控服务器等待关闭的TCP连接数情况,如果大于5000就告警

8、Node_exporter监控服务器入口流量

PromQL语句:

round((sum
  by(instance) (irate(node_network_receive_bytes_total{device!~"tap.*|veth.*|br.*|docker.*|virbr*|lo*",job="捷顺监控"}[5m])))
  / 1024 / 1024) > 50

说明:监控服务器入口流量情况,如果入口流量大于50M就告警

9、Node_exporter监控服务器出口流量

PromQL语句:

round((sum
  by(instance) (irate(node_network_transmit_bytes_total{device!~"tap.*|veth.*|br.*|docker.*|virbr*|lo*",job="捷顺监控"}[5m])))
  / 1024 / 1024) > 50

说明:监控服务器出口流量情况,如果出口流量大于50M就告警

猜你喜欢

转载自blog.csdn.net/qq_31555951/article/details/110666480