优秀的监控系统具备哪些特质
一般认为,优秀的运维监控系统,需要具备以下特点
- 快,系统故障能及时发现问题并上报
- 准,不能误报、重复报、最好去掉告警噪音,推送有价值的告警
- 全,一个平台监控所有的运维对象,避免运维孤岛导致信息不全、无法故障根因分析
- 闭环,能发现问题,也能提供解决问题的方案和能力。这个是当前主流监控系统普遍欠缺的。
- 开箱即用,轻量级部署。
LinkSLA智能运维管家围绕以上几点在平台上得到了重复体现,具体的讲几个技术细节吧。
- 系统采集频率默认30秒一次,可以迅速发现问题并上报。
- 系统提供预置告警规则,告警规则支持多种自定义函数、机器学习算法、简单和复杂表达式最大程度进行告警抑制、防抖,来体现告警的真实性
- 通过业务系统链路、时间等因素进行告警合并,通过业务系统链路,可以查看事件对业务的影响分析和辅助根因分析。同时还提供知识推荐,供用户参考。
- 工单的接收到流转直至闭环,全程MOC工程师跟踪和督导。发现问题,解决问题,避免类似问题才是我们平台价值。
- 我们平台基于saas,用户只需要下载采集器就可以迅速接入平台。