grafana监控钉钉/邮件报警

系统环境

系统版本:centos7

服务端ip:192.168.0.226

grafana版本:6.7.2

监控媒介:prometheus

注意:grafana的的图形化界面显示效果很好,但是报警功能有待加强,

  1. 只支持显示类型为Graph图表的报警,不支持其他图表的报警。
  2. 不支持zabbix数据源的报警功能;
  3. 不支持prometheus变量模板的报警;支持prometheus中没有变量的Graph图表的报警功能(邮件、钉钉等)

基于以上的情况,本文将以prometheus作为数据源,分享一下本人的一些操作中遇到的问题及处理。上篇文章已经介绍过了如何部署prometheus。

一、钉钉报警源添加

  1. 首先需要登录电脑端的钉钉(移动端没有权限),然后在群组里面添加一个自定义的机器人。具体步骤如下:               【电脑钉钉 】-【群聊】-【群设置】-【智能群助手】-【添加更多】-【添加机器人】-【自定义】-【添加】,编辑机器人名称和选择添加的群组。完成必要的安全设置(至少选择一种),勾选 我已阅读并同意《自定义机器人服务及免责条款》,点击“完成”即可。
  2. 开启成功后,会生成一个Webhook的地址,先把这个链接地址复制下来,然后到grafana中进行配置,如下图:
  3. 在grafana中打开监控模块,进行配置。
  4. 然后把钉钉的Webhook地址添加到里面,进行保存,并且测试。
  5. 接着钉钉客户端会收到测试的报警消息。但是详情无法打开,不知是不是我配置的原因。

二、钉钉报警具体配置

  • 开头已经介绍过了,zabbix数据源不支持报警,不支持prometheus变量模板的报警;支持prometheus中没有变量的Graph图表的报警功能。下面简单介绍一下。
  1. 选择一个prometheus数据源,没有变量模板的,并且是Graph图片的显示项进行测试。
  2. 因为我是直接导入的prometheus的模板,带有变量,所以先把模板中的变量简单修改一下。原来的是变量,这边改变成了主机的实体ip,如下图:
  3. 然后 ,我们添加并定义报警指标。
  4. 配置一下定义的报警条件,简单如下。
  5. 然后,保存,可以使用stress命令简单压力测试一下,到达条件,就会自动实现钉钉报警。

三、邮件报警

  • 如果要使用邮件报警,需要先在grafana中配置邮箱信息。具体如下:
  1. 首先进入/etc/grafana/grafana.ini文件中,配置邮箱信息。本文使用qq邮箱为例,需要先在QQ邮箱中开通邮箱客户端,获得授权码,填写到密码区域。
  2.  然后重启grafana服务。
  3. 测试邮箱发送,出现以下提醒,证明成功,如果没有收到邮件,请检查配置文件及日志,分析错误。
  4.  登录qq邮箱,查看收件箱有没有测试邮件产生。

四、总结 

大家可以根据自己的监控项,配置报警条件,选择自己习惯的报警方式进行监控报警。

以上为本人实际操作心得体会,欢迎大家一起留言讨论,指正。

猜你喜欢

转载自blog.csdn.net/tiny_du/article/details/108448344
今日推荐