)
前言
接触过各式各样的监控,开源的CAT、zipkin、pinpoint等等,并深度二次开发过;也接触过收费的听云监控。深知各类监控的亮点与局限,前段时间需要快速落地一套易用、合适,又要有亮点的监控体系,所以接触了prometheus监控体系。
通常监控主要分为 采集(日志、metrics)、上报数据(http、tcp)、消费聚合、存储、告警模块。采集上报主要是客户端的核心功能,一般有AOP方式嵌入代码的、手动埋点的、探针的(字节码自动织入)等方式。
什么是监控
一套产品化的,衡量、管理技术体系的工具或解决方案。
这套产品主要解决两个问题(产品价值):
1、技术:将系统的各种功能、健康状态数据化、可视化,可查看、告警,及时保证技术体系的稳定、安全等等
2、业务:将各种业务数据化、可视化,以供分析、干预,及时保证业务高效开展等等。
监控的基础原则
-
事前监控:架构设计阶段务必需要考虑监控,而不是等到部署上线才去考虑
-
监控什么:
对于一般业务来讲,建议先监控离用户最近的地方,用户的良好体验是推动业务发展的动力,这也是最敏感、重要的地方。
-
易用,易接入,尽可能自动化
-
能够协助故障定位与解决
-
警报与通知:
哪些问题需要通知?(如:需要人工干预的,今发布有意义的通知)
通知谁?(如:一线系统负责人)
如何通知?(如:短信、电话、其他通信工具;信息清晰、准确、可操作)
多久通知一次?(如:5分钟)
何时停止通知以及何时升级到其他人?(如:已恢复正常;两个小时问题未恢复,升级通知到其他人) -
可视化:清晰的显示各类数据,以及告警等信息记录等
Prometheus
Prometheus 灵感来源与Google的Borgmon,主要用于近实时、基于动态云环境、容器的微服务、应用程序的监控。
Prometheus专注于当下正在发生的各类数据,而不是追踪数周以前的数据,因为他们认为“大多数监控查询以及告警等都是一天内的数据”,Facebook相关论文也验证了这一点:85%的时序查询是26小时之内的。
简单来概括,Prometheus是一个监控系统,并行自带时序数据能力。
Prometheus架构
Prometheus 主要通过pull的方式获取被监控程序(target)中暴漏出来的时序数据。当然也提供了pushgateway进程,一般少量数据也可以push方式发送。push、pull方式各有利弊,prometheus之所以主要使用pull,主要因为:“”
指标收集
Prometheus通过pull的方式拉取外部进程中的时序数据,这些外部进程Prometheus官网称为EndPoint。Prometheus会让用户配置相关信息:目标进程暴漏方式(http url)、如何连接、连接身份验证等等信息。
服务发现
可以通过多种方式来处理监控的资源的发现:
- 人工的配置文件列表
- 基于文件的发现
- 自动发现(后文详述)
聚合、查询和报警
内置的PromQL可以快速的支持聚合和多种形式的查询,并可通过自带的可视化界面在浏览器中使用。也可以使用Grafana
配套的AlertManager基于gossip协议,可以管理、过滤各类告警信息。
高可用方案
后文详述
Prometheus 数据模型
Prometheus与其他主流时序数据库一样,在数据模型定义上,也会包含metric name、一个或多个labels(同InfluxDB里的tags含义)以及metric value。metric name加一组labels作为唯一标识,来定义time series,也就是时间线。在查询时,支持根据labels条件查找time series,支持简单的条件也支持复杂的条件。
上图是所有数据点分布的一个简单视图,横轴是时间,纵轴是时间线,区域内每个点就是数据点。Prometheus每次接收数据,收到的是图中区域内纵向的一条线。这个表述很形象,因为在同一时刻,每条时间线只会产生一个数据点,但同时会有多条时间线产生数据,把这些数据点连在一起,就是一条竖线。这个特征很重要,影响数据写入和压缩的优化策略。
保留时间
Prometheus专注于短期监控、告警而设计,所以默认它只保存15天的时间序列数据。如果要更长期,建议考虑数据单独存储到其他平台。
删除文本
引用文本
H2O is是液体。
210 运算结果是 1024.
链接: link.
图片:
带尺寸的图片:
居中的图片:
居中并且带尺寸的图片:
当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。
如何插入一段漂亮的代码片
去博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片
.
// An highlighted block
var foo = 'bar';
生成一个适合你的列表
- 项目
- 项目
- 项目
- 项目
- 项目1
- 项目2
- 项目3
- 计划任务
- 完成任务
创建一个表格
一个简单的表格是这么创建的:
项目 | Value |
---|---|
电脑 | $1600 |
手机 | $12 |
导管 | $1 |
设定内容居中、居左、居右
使用:---------:
居中
使用:----------
居左
使用----------:
居右
第一列 | 第二列 | 第三列 |
---|---|---|
第一列文本居中 | 第二列文本居右 | 第三列文本居左 |
SmartyPants
SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:
TYPE | ASCII | HTML |
---|---|---|
Single backticks | 'Isn't this fun?' |
‘Isn’t this fun?’ |
Quotes | "Isn't this fun?" |
“Isn’t this fun?” |
Dashes | -- is en-dash, --- is em-dash |
– is en-dash, — is em-dash |
创建一个自定义列表
- Markdown
- Text-to- HTML conversion tool
- Authors
- John
- Luke
如何创建一个注脚
一个具有注脚的文本。1
注释也是必不可少的
Markdown将文本转换为 HTML。
KaTeX数学公式
您可以使用渲染LaTeX数学表达式 KaTeX:
Gamma公式展示 是通过欧拉积分
你可以找到更多关于的信息 LaTeX 数学表达式here.
新的甘特图功能,丰富你的文章
- 关于 甘特图 语法,参考 这儿,
UML 图表
可以使用UML图表进行渲染。 Mermaid. 例如下面产生的一个序列图:
这将产生一个流程图。:
- 关于 Mermaid 语法,参考 这儿,
FLowchart流程图
我们依旧会支持flowchart的流程图:
- 关于 Flowchart流程图 语法,参考 这儿.
导出与导入
导出
如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。
导入
如果你想加载一篇你写过的.md文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,
继续你的创作。
注脚的解释 ↩︎