系统化全方位监控告警,这一篇足矣

版权声明:本文为博主原创文章,未经博主同意不得转载。

https://blog.csdn.net/z50L2O08e2u4afToR9A/article/details/79695361

Q1花了较大的篇幅,系统化讲述了监控与告警体系的建立,本文稍作总结。假设恰巧你正在搭建自己主动化监控与告警平台,也许,细读这一系列文章就够了。


一《监控告警。集群信息管理先行

  • 什么是集群信息管理

  • 使用配置文件进行集群信息管理

  • 使用服务进行集群信息管理

  • 使用配置中心进行集群信息管理


二《监控告警,员工信息管理,分级告警策略

  • 使用配置文件进行员工信息管理

  • 使用服务进行员工信息管理

  • 常见分级告警策略:告警收敛。分时告警,逐层上报,黑白跳动


三《多维度立体化监控

  • 什么是多维度立体化监控

  • 立体化监控有哪些维度

  1. 操作系统+进程+port

  2. http状态码

  3. 服务存活性

  4. 接口处理时间

  5. http接口

  6. log监控

  7. 用户视角

  • 怎样高速实施“1.操作系统+进程+port”的监控

  • 怎样高速实施“2.http状态码”的监控

  • 怎样高速实施“3.服务存活性”的监控

  • 怎样高速实施“4.接口处理时间”的监控


四《一分钟搞定“http接口”监控框架

  • 常见http监控玩法

  • 常见http监控的弊端

  • 通用可扩展http监控平台架构

  • 简版http监控框架架构

  • 100行伪代码搞定http监控


五《一分钟搞定“log”监控框架

  • 什么是日志监控

  • 日志分级,错误日志监控,正常日志监控

  • 日志与文件夹规范

  • 集中式日志监控及实现方案

  • 分散式日志监控及实现方案

  • 90行伪代码搞定log监控


六《一分钟搞定“用户视角”监控

  • 什么是用户视角的监控

  • 机房布点法

  • 端上报法

  • 第三方监控法


希望这六篇文章,对大家建立体系化的监控告警平台能有所帮助。告别背锅的时光。


调研一。下列场景大家是否常常遇到:

  • 用户和老板总是比研发先发现线上问题

  • 总是须要凌晨起床处理线上问题

  • 短信一响就异常紧张


调研二。下列技术体系大家是否已经具备:

  • 集群信息管理

  • 员工信息管理

  • 分级告警策略

  • 多维度立体化监控

  1. 操作系统+进程+port

  2. http状态码

  3. 服务存活性

  4. 接口处理时间

  5. http接口

  6. log监控

  7. 用户视角


求帮

猜你喜欢

转载自www.cnblogs.com/tlnshuju/p/9898238.html