プロメテウスは、(A)のインストールと使用状況を監視します

原理は、直接の操作で、言っているわけではありません

プロメテウスプッシュゲートウェイリファレンス:https://github.com/prometheus/pushgateway

プロメテウスサーバリファレンス:https://github.com/prometheus/prometheus#install

Grafana 参考:http://docs.grafana.org

 

 

インストール

wgetのhttps://github.com/prometheus/prometheus/releases/download/v2.8.1/prometheus-2.8.1.linux-amd64.tar.gz

 

タール-zxvfプロメテウス-2.8.1.linux-amd64.tar.gz -Cは/ usr / local /

CDは/ usr / local

MVプロメテウス-2.8.1.linux-AMD64 /プロメテウス

CDのプロメテウス/

 ./prometheus --version

 

変更 prometheus.yml 開始を決定するためにファイルを腹腔

 

変更 prometheus.yml 開始を決定するためにファイルを腹腔

編集した後、あなたが直接起動することができます

./prometheus

 

サービスを開始するには、このアカウントで、後者のユーザーを追加します。

[ルート@ localhostのはプロメテウス]#groupaddのプロメテウス

[ルート@ localhostのはプロメテウス]#useraddの-gプロメテウス-s / sbinに/ nologinにプロメテウス

エンパワーメントと作成プロメテウス運転データディレクトリを

[ルート@ localhostのはプロメテウス]#のCD〜

[ルート@ localhostの〜]#chownコマンド-Rプロメテウス:プロメテウスは/ usr / local /プロメテウス/

[ルート@ localhostの〜]#1は、mkdir -p /ホーム/ソフトウェア/プロメテウスデータ

[ルート@ localhostの〜]#chownコマンド-Rプロメテウス:プロメテウス/ホーム/ソフトウェア/プロメテウスデータ

 

設定したブート

[ルート@ localhostの〜]#タッチ/usr/lib/systemd/system/prometheus.service

[ルート@ localhostの〜]#chownコマンドプロメテウス:プロメテウス/usr/lib/systemd/system/prometheus.service

[ルート@ localhostの〜]#のVimの/usr/lib/systemd/system/prometheus.service

[単位]

説明=プロメテウス

ドキュメント= HTTPS://prometheus.io/

= network.target後

 

[サービス]

#タイプをするように設定されている通知し、サービスを再起動していきます

タイプ=シンプル

ユーザー=プロメテウス

#--Storage.tsdb.pathは、実行ディレクトリのデフォルトのデータディレクトリオプションです./dadaのディレクトリ

ExecStart =は/ usr / local /プロメテウス/プロメテウス--config.file =は/ usr / local /プロメテウス/ prometheus.yml --storage.tsdb.path = /ホーム/ソフトウェア/プロメテウスデータ

再起動=オンの失敗

 

[インストール]

WantedBy = multi-user.target

 

プロファイルの設定ブートを変更します

再度、設定ファイルを変更します。

Vimのprometheus.yml

#私のグローバル設定

グローバル:

  scrape_interval:15S#が15秒ごとにこすり間隔を設定します。デフォルトは1分ごとです。

  evaluation_intervalは:15S#が15秒ごとにルール評価します。デフォルトは1分ごとです。

  #1 scrape_timeoutは、グローバルなデフォルト(10秒)に設定されています。

 

#のAlertManagerの設定

警告:

  alertmanagers:

  - static_configs:

    - ターゲット:

      # - のAlertManager:9093

 

#ロードルールは、一度、定期的にグローバルな「evaluation_intervalは」に従ってそれらを評価します。

rule_files:

  # - "first_rules.yml"

  # - "second_rules.yml"

 

#こすりするために正確に一つのエンドポイントを含むスクレープ構成:

#ここでは、プロメテウスそのものです。

scrape_configs:

  #ジョブ名は、この設定から掻き取りいかなる時系列に `仕事= <JOB_NAME>`ラベルとして追加されます。

  - JOB_NAME: 'プロメテウス'

 

    「/メトリクス」に#のmetrics_pathのデフォルト

    「HTTP」に#スキームのデフォルト設定。

    scrape_interval:5秒

 

    static_configs:

      - ターゲット:[ '192.168.33.134:9090']

        ラベル:

          インスタンス:プロメテウス

 

  - JOB_NAME: 'centos7-machine1に'

    scrape_interval:10秒

    static_configs:

      - ターゲット:[ '192.168.33.131:9100']

        ラベル:

          インスタンス:ノード1

 

  - JOB_NAME: 'centos7-machine2で'

    scrape_interval:10秒

    static_configs:

      - ターゲット:[ '192.168.33.132:9100']

        ラベル:

          インスタンス:ノード2

 

  - JOB_NAME: 'centos7-machine3に'

    scrape_interval:10秒

    static_configs:

      - ターゲット:[ '192.168.33.132:9100']

        ラベル:

          インスタンス:ノード3

 

  - JOB_NAME: 'centos7-machine4'

    scrape_interval:10秒

    static_configs:

      - ターゲット:[ '192.168.33.134:9100']

        ラベル:

          インスタンス:ノード4

  - JOB_NAME: 'win2012-machine5'

    scrape_interval:10秒

    static_configs:

      - ターゲット:[ '192.168.33.135:9182']

        ラベル:

          インスタンス:NODE5

[ルート@のプロメテウス〜]#systemctlのプロメテウスを有効にします

[ルート@のプロメテウス〜]#は、プロメテウスを開始systemctl

提供のiptables またはfirewalld (直接試験環境オフ)

 

 

起動して確認します

1 )チェックサービスのステータス

[ルート@のプロメテウス〜]#systemctlのステータスプロメテウス

 

 

2 ウェブUI

プロメテウスは、簡単な付属しています UI

 

 

ではステータスメニュー、設定ルール目標など、

彫像- > [設定] を表示し prometheus.ymlの設定、次のように

Statu-->Targets展示监控具体的监控目标

centos还没有监控到,一会安装插件

绘图

访问http://192.168.33.134:9090/metrics  查看从exporter具体能抓到的数据,如下

三.部署node_exporter

Node_exporter收集机器的系统数据,这里采用prometheus官方提供的exporter,除node_exporter外,官方还提供consulmemcachedhaproxymysqldexporter,具体可查看官网。

 

这里在prometheus服务和 node节点部署相关服务。

tar -zxvf node_exporter-0.17.0-rc.0.linux-amd64.tar.gz -C /usr/local/

cd /usr/local/

mv node_exporter-0.17.0-rc.0.linux-amd64 node_exporter

设置用户(节点)

groupadd prometheus

useradd -g prometheus -s /sbin/nologin prometheus

chown -R prometheus:prometheus /usr/local/node_exporter

 

[root@node1 ~]# vim /usr/lib/systemd/system/node_exporter.service

[Unit]

Description=node_exporter

Documentation=https://prometheus.io/

After=network.target

[Service]

Type=simple

User=prometheus

ExecStart=/usr/local/node_exporter/node_exporter

Restart=on-failure

[Install]

WantedBy=multi-user.target

 

[root@node1 ~]# systemctl enable node_exporter

[root@node1 ~]# systemctl start node_exporter

grafana安装

wget https://dl.grafana.com/oss/release/grafana-6.1.3-1.x86_64.rpm 

 

yum -y localinstall grafana-6.1.3-1.x86_64.rpm

 

配置文件

配置文件位于/etc/grafana/grafana.ini,这里暂时保持默认配置即可

设置开机启动

systemctl enable grafana-server

systemctl start grafana-server

防火墙管理(测试环境直接关闭)

 

添加数据

访问:http://192.168.33.134:3000,默认账号/密码:admin/admin

默认登录后,要求改密码,可以选择先跳过

 

添加数据源

在登陆首页,点击"Add data source"按钮,跳转到添加数据源页面,配置如下:

Name: prometheus

Type: prometheus

URL: http://localhost:9090/

Access: proxy

取消Default的勾选,其余默认,点击"Add",如下:

"Dashboards"页签下"import"自带的模版,如下:

发现是空的

 

导入dashboard

grafana官网下载相关dashboaed到本地,如:https://grafana.com/dashboards/405

Grafana首页-->左上角图标-->Dashboard-->import

加入1-node-exporter-0-16-0-17-for-prometheus_rev7.json这个插件

如果出现grafana-piechart-panel这个报错

1.安装pie插件

官网:https://grafana.net/plugins/grafana-piechart-panel  

grafana-cli plugins install grafana-piechart-panel

2.重启grafana-server

即可恢复,效果如下

现在监控正常了,我们开始把服务加入这个项目中,现在各个节点安装node_exporter-0.17.0-rc.0.linux-amd64.tar.gz

 部署

[root@node1 src]# tar -zxvf node_exporter-0.17.0-rc.0.linux-amd64.tar.gz -C /usr/local/

[root@node1 src]# cd /usr/local/

[root@node1 local]# mv node_exporter-0.17.0-rc.0.linux-amd64/ node_exporter/

 

2. 设置用户

groupadd prometheus

useradd -g prometheus -s /sbin/nologin prometheus

chown -R prometheus:prometheus /usr/local/node_exporter/

3. 设置开机启动

 

[root@node1 ~]# vim /usr/lib/systemd/system/node_exporter.service

[Unit]

Description=node_exporter

Documentation=https://prometheus.io/

After=network.target

[Service]

Type=simple

User=prometheus

ExecStart=/usr/local/node_exporter/node_exporter

Restart=on-failure

[Install]

WantedBy=multi-user.target

 

[root@node1 ~]# systemctl enable node_exporter

[root@node1 ~]# systemctl start node_exporter

 

监控win主机

安装wmi_exporter-0.3.3-amd64.msi

https://github.com/martinlindhe/wmi_exporter/releases/download/v0.3.3/wmi_exporter-0.3.3-amd64.msi

下载后,安装插件

访问http://ip:9182/metrics后,如图

说明安装成功

 

 

 

 

telegram报警设置

telegram@BotFather,并加为好友,然后,创建你的机器人

填入红色涂鸦的地方

https://api.telegram.org/bot{$token}/getUpdates

token换成你自己刚刚注册到的那个红色标注的字符串

 

后连接 变成为https://api.telegram.org/bot690994839:AAGejCWBwy4gKun9B6q7-Il2uooz0OYXlOU/getMe

返回如下则成功

验证完毕,我们删掉这个token,重新申请一个来解决

打开这个选项

然后,将这个机器人拉入报警群

和它进行交流后,在此刷新下面的命令

https://api.telegram.org/bot887549729:AAFyS949ryyYxbJI3mRS6ScW8qXbd7Yc0Og/getUpdates

然后发现找到了chatid

 

おすすめ

転載: www.cnblogs.com/fatyao/p/11007357.html