Promethus(普罗米修斯)的Grafana+onealert实现报警功能

1、Centos7安装Promethus(普罗米修斯)监控系统完整版

2、Promethus(普罗米修斯)监控Mysql数据库

3、Promethus(普罗米修斯)安装Grafana可视化图形工具

4、Promethus的Grafana图形显示MySQL监控数据

5、Promethus(普罗米修斯)的Grafana+onealert实现报警功能

目录

1、Centos7安装Promethus(普罗米修斯)监控系统完整版

2、Promethus(普罗米修斯)监控Mysql数据库

3、Promethus(普罗米修斯)安装Grafana可视化图形工具

4、Promethus的Grafana图形显示MySQL监控数据

Grafana+onealert报警

1、 先在onealert里添加grafana应用(申请onealert账号)

2、在Grafana中配置Webhook URL

现在可以去设置一个报警来测试了(这里以我们前面加的cpu负载监控来 做测试)

最终的邮件报警效果:

测试mysql链接数报警

总结报警不成功的可能原因

扩展


Grafana+onealert报警

prometheus报警需要使用alertmanager这个组件,而且报警规则需要手 动编写(对运维来说不友好)。所以我这里选用grafana+onealert报警。

注意: 实现报警前把所有机器时间同步再检查一遍.

ntpdate time.windows.com

1、 先在onealert里添加grafana应用(申请onealert账号)

https://caweb.aiops.com/

2、在Grafana中配置Webhook URL

1、在Grafana中创建Notification channel,选择类型为Webhook;

2、推荐选中Send on all alerts和Include image,Cloud Alert体验更佳;

3、将第一步中生成的Webhook URL填入Webhook settings Url;

4、Http Method选择POST;

5、Send Test&Save;

现在可以去设置一个报警来测试了(这里以我们前面加的cpu负载监控来 做测试)

配置

保存后就可以测试了

如果node1上的cpu负载还没有到0.5,你可以试试0.1,或者运行一些程序 把node1负载调大。最终能测试报警成功

模拟cpu负载

cat /dev/urandom | md5sum

最终的邮件报警效果:

测试mysql链接数报警

总结报警不成功的可能原因

  • 各服务器之间时间不同步,这样时序数据会出问题,也会造成报警出问 题
  • 必须写通知内容,留空内容是不会发报警的
  • 修改完报警配置后,记得要点右上角的保存
  • 保存配置后,需要由OK状态变为alerting状态才会报警(也就是说,你 配置保存后,就已经是alerting状态是不会报警的)
  • grafana与onealert通信有问题

扩展

prometheus目前还在发展中,很多相应的监控都需要开发。但在官网的 dashboard库中,也有一些官方和社区开发人员开发的dashboard可以直接 拿来用。

相关博文

 

1、Centos7安装Promethus(普罗米修斯)监控系统完整版

2、Promethus(普罗米修斯)监控Mysql数据库

3、Promethus(普罗米修斯)安装Grafana可视化图形工具

4、Promethus的Grafana图形显示MySQL监控数据

5、Promethus(普罗米修斯)的Grafana+onealert实现报警功能

 

发布了165 篇原创文章 · 获赞 39 · 访问量 5万+

猜你喜欢

转载自blog.csdn.net/heian_99/article/details/103959379