如何快速优化 CnosDB 数据库性能与延迟:使用 Jaeger 分布式追踪系统

在正式的生产环境中,数据库的性能和延迟对于确保系统的稳定和高效运行至关重要。特别是在与 CnosDB 数据库进行交互时,更深入地了解其表现变得尤为重要。这时Jaeger 分布式追踪系统发挥了巨大的作用。在本篇博客中,我们将深入探讨如何通过使用 Jaeger 追踪和监控 CnosDB 数据库,以便更全面地了解其性能、延迟以及潜在的问题。

了解 Jaeger 和 CnosDB

Jaeger:Jaeger 是一款强大的开源分布式追踪系统,兼容 OpenTracing API,专为监控和调试软件服务架构中的请求流程而设计。通过捕获请求在不同微服务之间的流动,Jaeger 帮助开发人员识别性能瓶颈和潜在问题。

CnosDB:CnosDB 是一款高性能的开源数据库,常用于存储和管理大量时序数据。在微服务架构中,CnosDB 通常充当数据存储和检索的后端。

在CnosDB中启用Jaeger支持

取消 [trace][https://docs.cnosdb.com/zh/latest/reference/config.html#trace]配置注释开启 Jaeger 跟踪功能。

| 提示:如需使配置生效需要重启服务。

[trace]
  auto_generate_span = false
[trace.log]
  path = '/tmp/cnosdb'
[trace.jaeger]
  jaeger_agent_endpoint = 'http://127.0.0.1:14268/api/traces'
  max_concurrent_exports = 2
  max_queue_size = 4096

安装并启动Jaeger

| 其他部署方式,请参考 Jaeger Deployment[https://www.jaegertracing.io/docs/deployment/]

docker run -d --name jaeger \
  -p 6831:6831/udp \
  -p 6832:6832/udp \
  -p 16686:16686 \
  -p 14268:14268 \
  jaegertracing/all-in-one:latest

成功启动后,使用浏览器访问 http://127.0.0.1:16686

跟踪CnosDB中的事件

1.在请求中添加 span context。

| 可以设置配置文件中的 auto_generate_span = true 自动生成,如果需要分析特定的语句,请在请求中自定义 uber-trace-id 值,格式如下所示(详细格式说明请参考:Propagation Format[https://www.jaegertracing.io/docs/1.46/client-libraries/#propagation-format])

uber-trace-id: 3a3a43:432e345:0:1

示例:

| 示例中的数据来源请参考:
https://docs.cnosdb.com/zh/latest/start/quick_start.html

查询数据库 oceanic_station 中 air 表中的数据,并且按时间倒序排序,返回前 5 条数据 。

curl -i -u "root:" -H "Accept: application/json" -H "uber-trace-id: 3a3a43:432e345:0:1" -XPOST "http://127.0.0.1:8902/api/v1/sql?db=oceanic_station&pretty=true" -d "select * from air order by time desc limit 5;"

使用仪表盘进行分析

1.记录 Span:

当客户端应用程序发送查询或写入请求到 CnosDB 数据库时,CnosDB 会将产生的 Span 记录发送给Jaeger 。每个 span 表示了请求的一个阶段,包括了处理时间、操作名称和其他相关信息。

2.选择 Service:

在 Jaeger 用户界面的 Service 下拉框中,选择与 CnosDB 相关的服务(例如:cnosdb_singleton_1001)。

3.查找 Traces:

在界面上,点击 "Find Traces" 按钮,系统将检索与选择的服务相关的所有 traces(追踪)。这将显示一系列的请求和对应的 spans。

4.分析 Trace 详情:

点击所感兴趣的 trace,进入详细视图。在这个视图中,你将看到整个请求的流程,以及每个 span 执行的时间。这些时间信息将帮助你了解查询的每个步骤在处理时所花费的时间。

5.优化查询和系统:

利用详细的时间记录,你可以精确地分析查询语句的性能。在正式的生产环境中,这将成为优化查询语句和改进系统性能的宝贵工具。通过分析每个 span 的执行时间,你可以找到可能导致延迟的步骤,从而采取针对性的优化措施。

除此之外,Jaeger 还可以跟踪 CnosDB 的其他事件,具体如下:

  1. Query 组件
  2. REST API
  3. Arrow Flight SQL API

结语

通过使用 Jaeger 来跟踪 CnosDB 数据库的性能和延迟,我们可以更全面地了解数据库的表现。通过在关键代码段中插入适当的仪器化代码,我们可以捕获请求的流动和数据库交互,轻松识别性能瓶颈,并及时解决潜在问题。集成 Jaeger 和 CnosDB,让我们能够从中获得更深入的洞察,提升整体性能和可靠性。

拓展示例

REST API请求

curl -i -u "root:" -H "Accept: application/json" -H "uber-trace-id: 3a3a43:432e345:0:1" -XPOST "http://127.0.0.1:8902/api/v1/sql?db=usage_schema&pretty=true" -d "select * from user_queries order by time desc limit 5;"

curl -i -u "root:" -H "Accept: application/json" -H "uber-trace-id: 3a3a43:432e345:0:1" -XPOST "http://127.0.0.1:8902/api/v1/sql?db=usage_schema&pretty=true" -d "CREATE TABLE air (visibility DOUBLE,temperature DOUBLE,presssure DOUBLE,TAGS(station));"

curl -i -u "root:" -H "Accept: application/json" -H "uber-trace-id: 3a3a43:432e345:0:1"  -XPOST "http://127.0.0.1:8902/api/v1/write?db=public&pretty=true" -d "ma,station=XiaoMaiDao visibility=50,temperature=63,pressure=52"

使用 Prometheus 进行远程读写

remote_write:
- url: "http://127.0.0.1:8902/api/v1/prom/write?db=prometheus"
 headers:
 uber-trace-id: '3a3a43:432e345:0:1'
 basic_auth:
 username: 'root'
 password: ''
remote_read cnosdb
remote_read:
- url: "http://127.0.0.1:8902/api/v1/prom/read?db=prometheus"
headers:
 uber-trace-id: '3a3a43:432e345:0:1'
basic_auth:
 username: 'root'
 password:

使用 OpenTSDB 写入

curl -i -u "root:" -H "Accept: application/json" -H "uber-trace-id: 3a3a43:432e345:0:1" -XPOST "http://127.0.0.1:8902/api/v1/opentsdb/write?db=public" -d 'opentsdb 1689054412124000000 1 tag1=t1 field1="f1" value1=1'

curl -i -u "root:" -H "Accept: application/json" -H "uber-trace-id: 3a3a43:432e345:0:1" -XPOST "http://127.0.0.1:8902/api/v1/opentsdb/put?db=public" -d '[{"metric":"tsdbput","timestamp": 1689069407572000000,"value": 9,"tags":{"tag1":"t1","tag2":"t2"}}]'

CnosDB简介

CnosDB是一款高性能、高易用性的开源分布式时序数据库,现已正式发布及全部开源。

欢迎关注我们的社区网站:https://cn.cnosdb.com

猜你喜欢

转载自blog.csdn.net/CnosDB/article/details/132328184