プロメテウスプロセスアラームがトリガされ、待機時間

プロメテウスプロセスアラームがトリガされ、待機時間

:アラームプロセスは以下の通りである
。1. HTTPは上記Promethes「scrape_interval」定義された時間間隔によって配置ターゲットホストインタフェース(インタフェースはAここで想定している)に露出プロメテウス監視サーバーを、定期的にターゲットホスト上の監視データを収集します。
2. Aは、サーバ側は「scrape_timeoutは」時間をしようとして停止するまで、インタフェースからデータを取得しようとしていきますときインタフェースは使用できません。この時、「DOWN」へのインタフェースの状態が変化。
3.プロメテウス「evaluation_intervalは」時間間隔、定期的に(デフォルトの1分)アラートルールを評価するための構成をしながら、評価期間に達したとき、インターフェースAは、真すなわちUP = 0、アラートがアクティブへDOWNが見出されました「保留」状態は、現在アクティブな時間を記録;
4.次の警告ルールの評価期間が来る、真である= 0 UP見つけるために、継続して、その後、アラーム時刻は「の」期間ルールでアクティブ超えたか否かを判断します超えていない場合、次の評価期間に進み、時間が超過した場合、「FIRING」に警報ステータスの変更は、のAlertManagerコールインターフェースを同時に警報関連データを送信します。
5.その後のAlertManagerがアラームデータを受信した後、警報情報がグループ化され、「group_wait」時間のAlertManager係る第1の構成を待ちます。待機時間後に再び他のアラーム情報を送信します。
6。前のアラームが正常に再送信するアラーム情報の前に、その後、間隔「group_interval」の時間間隔を送ってきた場合、同じ警告に属するアラートグループは、プロセスを待っていることは、新しいアラートを入力することができます。例えば、メールのアラームを設定し、その後、メールの要約を送られるアラーム情報のグループに属しています。
7.アラートグループでアラートが変更されていないと正常に送信されてきた場合は、送信時間間隔の後に同じ警告メッセージを繰り返して「repeat_intervalの」待って、アラームが正常に以前に送信されていない場合は、第6条にはトリガ条件に対応し、 group_interval待機時間間隔が繰り返し送信されます。
誰に特定同時に最後の警告情報、異なるアラーム送信周波数を設定するどのような条件の下で指定されたアラートの受信者として、ルート・ルーティング・ルールが存在するように構成することのAlertManager。

 

1、待機時間1

プロファイルを見る:vimのprometheus.yml

グローバル#のデータ収集間隔
  scrape_interval:15秒 
   評価の警報期間
  evaluation_intervalは:15S 
  データ集録デフォルトのタイムアウト10秒の
 #のscrape_timeout

 

2、時間2を待っています

プロフィール:vimのalertmanager.yml

ルートタグ:どのように警報伝達の割り当て
ルート:
   #1 GROUP_BY:どのタブに基づいてパケットを使用して 
  GROUP_BY:[ AlertName ]
   #のgroup_wait:パケット待ち時間
  group_wait:10秒の
   #1 group_interval:アラームを送信する二つの垂直間隔
  group_interval: 10Sの
   #のREPEAT_INTERVAL:繰り返し送信警告時間。デフォルトIH 
  REPEAT_INTERVAL:1M
   レシーバアラーム通知定義された 
  受信機:メールを

 

おすすめ

転載: www.cnblogs.com/xiangsikai/p/11289966.html