プロメテウスプロセスアラームがトリガされ、待機時間

プロメテウスプロセスアラームがトリガされ、待機時間

：アラームプロセスは以下の通りである
。1. HTTPは上記Promethes「scrape_interval」定義された時間間隔によって配置ターゲットホストインタフェース（インタフェースはAここで想定している）に露出プロメテウス監視サーバーを、定期的にターゲットホスト上の監視データを収集します。
2. Aは、サーバ側は「scrape_timeoutは」時間をしようとして停止するまで、インタフェースからデータを取得しようとしていきますときインタフェースは使用できません。この時、「DOWN」へのインタフェースの状態が変化。
3.プロメテウス「evaluation_intervalは」時間間隔、定期的に（デフォルトの1分）アラートルールを評価するための構成をしながら、評価期間に達したとき、インターフェースAは、真すなわちUP = 0、アラートがアクティブへDOWNが見出されました「保留」状態は、現在アクティブな時間を記録;
4.次の警告ルールの評価期間が来る、真である= 0 UP見つけるために、継続して、その後、アラーム時刻は「の」期間ルールでアクティブ超えたか否かを判断します超えていない場合、次の評価期間に進み、時間が超過した場合、「FIRING」に警報ステータスの変更は、のAlertManagerコールインターフェースを同時に警報関連データを送信します。
5.その後のAlertManagerがアラームデータを受信した後、警報情報がグループ化され、「group_wait」時間のAlertManager係る第1の構成を待ちます。待機時間後に再び他のアラーム情報を送信します。
6。前のアラームが正常に再送信するアラーム情報の前に、その後、間隔「group_interval」の時間間隔を送ってきた場合、同じ警告に属するアラートグループは、プロセスを待っていることは、新しいアラートを入力することができます。例えば、メールのアラームを設定し、その後、メールの要約を送られるアラーム情報のグループに属しています。
7.アラートグループでアラートが変更されていないと正常に送信されてきた場合は、送信時間間隔の後に同じ警告メッセージを繰り返して「repeat_intervalの」待って、アラームが正常に以前に送信されていない場合は、第6条にはトリガ条件に対応し、 group_interval待機時間間隔が繰り返し送信されます。
誰に特定同時に最後の警告情報、異なるアラーム送信周波数を設定するどのような条件の下で指定されたアラートの受信者として、ルート・ルーティング・ルールが存在するように構成することのAlertManager。

1、待機時間1

プロファイルを見る：vimのprometheus.yml

グローバル：
   ＃のデータ収集間隔
  scrape_interval：15秒 
   ＃評価の警報期間
  evaluation_intervalは：15S 
  ＃データ集録デフォルトのタイムアウト10秒の
 ＃のscrape_timeout

2、時間2を待っています

プロフィール：vimのalertmanager.yml

＃ルートタグ：どのように警報伝達の割り当て
ルート：
   ＃1 GROUP_BY：どのタブに基づいてパケットを使用して 
  GROUP_BY：[ 「AlertName 」]
   ＃のgroup_wait：パケット待ち時間
  group_wait：10秒の
   ＃1 group_interval：アラームを送信する二つの垂直間隔
  group_interval： 10Sの
   ＃のREPEAT_INTERVAL：繰り返し送信警告時間。デフォルトIH 
  REPEAT_INTERVAL：1M
   ＃レシーバアラーム通知定義された 
  受信機：「メールを」

プロメテウスプロセスアラームがトリガされ、待機時間

おすすめ