11-3 监控入门---从整体把握监控
监控目的?
1 及时发现已经出现的问题
2 体检预警可能发生的问题
监控什么?
1 系统基础指标
2 服务基础信息
3 服务个性化信息
4 日志
如何监控?
1 数据采集
2 数据存储
3 定义报警规则
4 配置报警方式
业内常见的监控组件/方案
1 zabbix
2 OpenFalcon
3 听云、监控宝
kubernetes的监控
1 每个节点的基础指标
2 每个容器的基础指标
3 kubernetes集群组件
11-4 Prometheus入门---架构和原理
起源
与kubernetes同源
2016.5加入CNCF
2018.8从CNCF毕业
Prometheus是什么?
1 一系列服务的组合
2 系统和服务的监控报警平台
Prometheus特征
1 由metric名称和kv表示的多维数据模型
2 灵活的查询语言(PromQl)
3 支持pull、push两种方式添加数据
4 支持基于Kubernetes服务发现的动态配置
架构
数据类型
Counter
Gauge
Histogram && Summary
数据来源 - 服务器基础指标
具体node_exporter的指标可以参照
https://github.com/prometheus/node_exporter
数据来源-docker容器指标
数据来源-kubernetes组件