Doris实战篇-Doris监控

简介

本监控使用的doris版本是1.2.0

监控和报警 - Apache Doris

相关资料

链接:https://pan.baidu.com/s/1yWCjootaPSfHsbRiiabq0w 
提取码:4sad 
--来自百度网盘超级会员V5的分享

操作 

1.检查指标是否启动(默认开启的)

Frontend: fe_host:fe_http_port/metrics
Backend: be_host:be_web_server_port/metrics
curl http://localhost:8081/metrics
curl http://localhost:8040/metrics

打印如下

doris_be_cpu{device="cpu1",mode="system"} 2048972
doris_be_cpu{device="cpu0",mode="system"} 2080255
doris_be_cpu{device="cpu",mode="idle"} 1775135302
doris_be_cpu{device="cpu1",mode="idle"} 876824953
doris_be_cpu{device="cpu0",mode="idle"} 898310348
doris_be_cpu{device="cpu",mode="iowait"} 634839
doris_be_cpu{device="cpu1",mode="iowait"} 201298
doris_be_cpu{device="cpu0",mode="iowait"} 433540
doris_be_cpu{device="cpu",mode="irq"} 0
doris_be_cpu{device="cpu1",mode="irq"} 0
doris_be_cpu{device="cpu0",mode="irq"} 0
doris_be_cpu{device="cpu",mode="soft_irq"} 134381
doris_be_cpu{device="cpu1",mode="soft_irq"} 69974
doris_be_cpu{device="cpu0",mode="soft_irq"} 64406
doris_be_cpu{device="cpu",mode="steal"} 0
doris_be_cpu{device="cpu1",mode="steal"} 0
doris_be_cpu{device="cpu0",mode="steal"} 0
doris_be_cpu{device="cpu",mode="guest"} 0
doris_be_cpu{device="cpu1",mode="guest"} 0
doris_be_cpu{device="cpu0",mode="guest"} 0
doris_be_cpu{device="cpu",mode="guest_nice"} 0
doris_be_cpu{device="cpu1",mode="guest_nice"} 0
doris_be_cpu{device="cpu0",mode="guest_nice"} 0
# TYPE doris_be_query_cache_partition_total_count gauge
doris_be_query_cache_partition_total_count 0
# TYPE doris_be_s3_file_writer_total counter
doris_be_s3_file_writer_total 0
# TYPE doris_be_file_created_total counter
doris_be_file_created_total 0
# TYPE doris_be_local_bytes_read_total counter
doris_be_local_bytes_read_total 0
# TYPE doris_be_process_fd_num_limit_soft gauge
doris_be_process_fd_num_limit_soft 65535

2.监控开启和关闭的小技巧。

#关闭prometheus
curl -X POST http://localhost:9090/-/quit
#开启上面使用http关闭的功能
nohup ./prometheus --web.enable-lifecycle --config.file=prometheus.yml > ./prometheus.log 2>&1 &

3.修改prometheus配置文件。

vi prometheus.yml
scrape_configs:
  # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
  - job_name: 'PALO_CLUSTER' # 每一个 Doris 集群,我们称为一个 job。这里可以给 job 取一个名字,作为 Doris 集群在监控系统中的名字。
    metrics_path: '/metrics' # 这里指定获取监控项的 restful api。配合下面的 targets 中的 host:port,Prometheus 最终会通过 host:port/metrics_path 来采集监控项。
    static_configs: # 这里开始分别配置 FE 和 BE 的目标地址。所有的 FE 和 BE 都分别写入各自的 group 中。
      - targets: ['feip:8081']
        labels:
          group: fe # 这里配置了 fe 的 group,该 group 中包含了 3 个 Frontends

      - targets: ['beip:8040', 'beip:8040']
        labels:
          group: be # 这里配置了 be 的 group,该 group 中包含了 3 个 Backends

4.重启prometheus。

#可以先测试下有没有错误
./prometheus --web.enable-lifecycle --config.file=prometheus.yml
#如果没有错误则按下面的情况启动
nohup ./prometheus --web.enable-lifecycle --config.file=prometheus.yml > ./prometheus.log 2>&1 &

5.登录Grafana导入官方监控文件。

相关doris监控指标介绍

Doris Grafana监控指标介绍 - OomSpot

猜你喜欢

转载自blog.csdn.net/S1124654/article/details/129579287