深入理解监控系统——Prometheus(正在写)


)

前言

接触过各式各样的监控,开源的CAT、zipkin、pinpoint等等,并深度二次开发过;也接触过收费的听云监控。深知各类监控的亮点与局限,前段时间需要快速落地一套易用、合适,又要有亮点的监控体系,所以接触了prometheus监控体系。

通常监控主要分为 采集(日志、metrics)、上报数据(http、tcp)、消费聚合、存储、告警模块。采集上报主要是客户端的核心功能,一般有AOP方式嵌入代码的、手动埋点的、探针的(字节码自动织入)等方式。

什么是监控

一套产品化的,衡量、管理技术体系的工具或解决方案。

这套产品主要解决两个问题(产品价值):
1、技术:将系统的各种功能、健康状态数据化、可视化,可查看、告警,及时保证技术体系的稳定、安全等等
2、业务:将各种业务数据化、可视化,以供分析、干预,及时保证业务高效开展等等。

监控的基础原则

  • 事前监控:架构设计阶段务必需要考虑监控,而不是等到部署上线才去考虑

  • 监控什么:

Created with Raphaël 2.2.0 业务逻辑\算法 应用程序\系统 操作系统

对于一般业务来讲,建议先监控离用户最近的地方,用户的良好体验是推动业务发展的动力,这也是最敏感、重要的地方。

  • 易用,易接入,尽可能自动化

  • 能够协助故障定位与解决

  • 警报与通知:
    哪些问题需要通知?(如:需要人工干预的,今发布有意义的通知)
    通知谁?(如:一线系统负责人)
    如何通知?(如:短信、电话、其他通信工具;信息清晰、准确、可操作)
    多久通知一次?(如:5分钟)
    何时停止通知以及何时升级到其他人?(如:已恢复正常;两个小时问题未恢复,升级通知到其他人)

  • 可视化:清晰的显示各类数据,以及告警等信息记录等

Prometheus

Prometheus 灵感来源与Google的Borgmon,主要用于近实时、基于动态云环境、容器的微服务、应用程序的监控。
Prometheus专注于当下正在发生的各类数据,而不是追踪数周以前的数据,因为他们认为“大多数监控查询以及告警等都是一天内的数据”,Facebook相关论文也验证了这一点:85%的时序查询是26小时之内的。

简单来概括,Prometheus是一个监控系统,并行自带时序数据能力。
在这里插入图片描述

Prometheus架构

在这里插入图片描述
Prometheus 主要通过pull的方式获取被监控程序(target)中暴漏出来的时序数据。当然也提供了pushgateway进程,一般少量数据也可以push方式发送。push、pull方式各有利弊,prometheus之所以主要使用pull,主要因为:“”

指标收集

Prometheus通过pull的方式拉取外部进程中的时序数据,这些外部进程Prometheus官网称为EndPoint。Prometheus会让用户配置相关信息:目标进程暴漏方式(http url)、如何连接、连接身份验证等等信息。

服务发现

可以通过多种方式来处理监控的资源的发现:

  • 人工的配置文件列表
  • 基于文件的发现
  • 自动发现(后文详述)

聚合、查询和报警

内置的PromQL可以快速的支持聚合和多种形式的查询,并可通过自带的可视化界面在浏览器中使用。也可以使用Grafana

配套的AlertManager基于gossip协议,可以管理、过滤各类告警信息。

高可用方案

后文详述

Prometheus 数据模型

Prometheus与其他主流时序数据库一样,在数据模型定义上,也会包含metric name、一个或多个labels(同InfluxDB里的tags含义)以及metric value。metric name加一组labels作为唯一标识,来定义time series,也就是时间线。在查询时,支持根据labels条件查找time series,支持简单的条件也支持复杂的条件。在这里插入图片描述
上图是所有数据点分布的一个简单视图,横轴是时间,纵轴是时间线,区域内每个点就是数据点。Prometheus每次接收数据,收到的是图中区域内纵向的一条线。这个表述很形象,因为在同一时刻,每条时间线只会产生一个数据点,但同时会有多条时间线产生数据,把这些数据点连在一起,就是一条竖线。这个特征很重要,影响数据写入和压缩的优化策略。

保留时间

Prometheus专注于短期监控、告警而设计,所以默认它只保存15天的时间序列数据。如果要更长期,建议考虑数据单独存储到其他平台。

删除文本

引用文本

H2O is是液体。

210 运算结果是 1024.

链接: link.

图片: Alt

带尺寸的图片: Alt

居中的图片: Alt

居中并且带尺寸的图片: Alt

当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。

如何插入一段漂亮的代码片

博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片.

// An highlighted block
var foo = 'bar';

生成一个适合你的列表

  • 项目
    • 项目
      • 项目
  1. 项目1
  2. 项目2
  3. 项目3
  • 计划任务
  • 完成任务

创建一个表格

一个简单的表格是这么创建的:

项目 Value
电脑 $1600
手机 $12
导管 $1

设定内容居中、居左、居右

使用:---------:居中
使用:----------居左
使用----------:居右

第一列 第二列 第三列
第一列文本居中 第二列文本居右 第三列文本居左

SmartyPants

SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:

TYPE ASCII HTML
Single backticks 'Isn't this fun?' ‘Isn’t this fun?’
Quotes "Isn't this fun?" “Isn’t this fun?”
Dashes -- is en-dash, --- is em-dash – is en-dash, — is em-dash

创建一个自定义列表

Markdown
Text-to- HTML conversion tool
Authors
John
Luke

如何创建一个注脚

一个具有注脚的文本。1

注释也是必不可少的

Markdown将文本转换为 HTML

KaTeX数学公式

您可以使用渲染LaTeX数学表达式 KaTeX:

Gamma公式展示 Γ ( n ) = ( n 1 ) ! n N \Gamma(n) = (n-1)!\quad\forall n\in\mathbb N 是通过欧拉积分

Γ ( z ) = 0 t z 1 e t d t . \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,.

你可以找到更多关于的信息 LaTeX 数学表达式here.

新的甘特图功能,丰富你的文章

Mon 06 Mon 13 Mon 20 已完成 进行中 计划一 计划二 现有任务 Adding GANTT diagram functionality to mermaid
  • 关于 甘特图 语法,参考 这儿,

UML 图表

可以使用UML图表进行渲染。 Mermaid. 例如下面产生的一个序列图:

张三 李四 王五 你好!李四, 最近怎么样? 你最近怎么样,王五? 我很好,谢谢! 我很好,谢谢! 李四想了很长时间, 文字太长了 不适合放在一行. 打量着王五... 很好... 王五, 你怎么样? 张三 李四 王五

这将产生一个流程图。:

链接
长方形
圆角长方形
菱形
  • 关于 Mermaid 语法,参考 这儿,

FLowchart流程图

我们依旧会支持flowchart的流程图:

Created with Raphaël 2.2.0 开始 我的操作 确认? 结束 yes no
  • 关于 Flowchart流程图 语法,参考 这儿.

导出与导入

导出

如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。

导入

如果你想加载一篇你写过的.md文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,
继续你的创作。


  1. 注脚的解释 ↩︎

发布了126 篇原创文章 · 获赞 192 · 访问量 26万+

猜你喜欢

转载自blog.csdn.net/lemon89/article/details/104088184