Zabbix第204回「専門家相談」Q&Aまとめ

質問 1Q
: 自動検出を設定するにはどうすればよいですか?

A: Zabbix で自動検出を設定するには、次の手順を使用できます。

  1. Zabbix の Web インターフェイスにログインします。

  2. 適切な権限を持つ管理者またはユーザーの役割を持っていることを確認してください。

  3. 「構成」メニューに移動し、「自動検出」を選択します。

  4. 「自動検出の作成」ボタンをクリックします。

  5. [名前] フィールドに、自動検出ルールの名前を入力します。

  6. [新しく検出されたデバイス] フィールドで、自動検出プロセス中にデバイスを作成する方法を選択します。ホスト名、SNMP OID、IP 範囲、またはその他のオプションの使用を選択できます。

  7. 検出間隔、SNMP 構成 (該当する場合)、IP 範囲などの他の自動検出ルール オプションを構成します。

  8. [フィルター] セクションでは、自動的に検出されたデバイスをフィルターするための条件を設定できます。たとえば、IP アドレス、SNMP OID、システム名などの属性を使用してフィルタリングできます。

  9. 「アクション」セクションでは、自動検出後に実行するアクションを定義できます。たとえば、ホストを自動的に追加したり、アクションや通知などをトリガーしたりできます。

  10. [追加] ボタンをクリックして自動検出ルールを保存します。

  11. [自動検出ルール] ページでルールを有効にし、トリガー、アクション、およびその他の関連構成が正しく設定されていることを確認します。

  12. Zabbix は、設定に基づいて定期的に自動検出を実行し、ルールに基づいて新しいデバイスを作成したり、その他のアクションを実行したりします。

Q:キー値には何を書けばいいですか? ここに画像の説明を挿入します
A: キー値の自動検出を構成する場合、プレースホルダーを使用して動的値を表すことができるため、データ収集が実際に実行されるときに実際の値に置き換えることができます。

自動検出のキーと値の構成の一般的な例をいくつか示します。

SNMP はキー値を自動的に検出します。

SNMP デバイスの CPU 使用率を取得します: snmp.get[{#SNMPINDEX},]

SNMP デバイスのインターフェースステータスを取得します: snmp.get[{#SNMPINDEX},ifOperStatus.{#SNMPVALUE}]

SNMP デバイスのメモリ使用量を取得します: snmp.get[{#SNMPINDEX},,]

上記の例では、{#SNMPINDEX} と {#SNMPVALUE} は、実際にデータ収集が実行されるときに対応する値に置き換えられるプレースホルダーです。

質問2Q
:監視項目のプロトタイプ作成時にエラーが報告されるのですが、何が問題なのでしょうか?

ここに画像の説明を挿入します
A: 自動検出ルールの名前とキーの値には、{#SNMPINDEX} を含める必要はありません。監視項目のプロトタイプには含めます。

Q: 自動検出ルール名は設定されましたが、監視項目のプロトタイプはどのように作成すればよいですか?

ここに画像の説明を挿入します
ここに画像の説明を挿入します
A: 監視項目のプロトタイプは、今設定した方法です。

Q:保存に失敗しましたが、追加しなくても保存できます。ここに画像の説明を挿入します
Q: OK、変数を使用して取得した値を保存するだけです。ここに画像の説明を挿入します
質問 3
Q: Zabbix アラームの収束はどのように行うべきですか?

A: アラームを収束させるために考えられる方法は次のとおりです。

  1. 重複したアラームをマージする: アラームがトリガーされたときに、同じアラーム通知が以前に送信されたかどうかを確認できます。その場合は、重複した通知を再度送信しないこと、または重複した通知を 1 つに結合することを選択できます。

  2. アラーム遅延の設定: 遅延時間を設定できます。この期間内に同じ問題が続く場合、アラーム通知は 1 回だけ送信されます。これにより、短期間に同じアラームが複数回トリガーされることを回避できます。

  3. アラームアップグレード: アラームルールを定義でき、同じ問題が一定回数連続して発生した場合にアラーム通知が送信されます。これにより、頻繁なアラームを引き起こす短期的な問題が回避されます。

  4. アラームのシールドとサイレント時間: すぐに処理する必要がない一部のアラームについては、シールド ルールまたはサイレント時間を設定して、アラーム通知の送信を防ぐことができます。この間、アラート通知は一時的に無視されます。

  5. アラーム分類: アラームのレベルごとに異なる処理方法と通知頻度を設定します。例えば、重大レベルのアラーム通知は担当者に送信され、警告レベルのアラーム通知はチームに送信されます。

Q: 先生、1 番目と 2 番目の方法はどのように実装すればよいですか?

A:

  1. 重複したアラームをマージします。

    • Zabbix のアクション設定では、「繰り返し間隔」(リカバリ操作) オプションを有効にすることを選択できます。

    • 適切な時間間隔を設定します。つまり、この時間内で同じ問題が継続する場合、アラーム通知は 1 回だけ送信されます。

    • これにより、短期間に同じアラームが複数回トリガーされることを回避できます。

    • この時間間隔は、特定のニーズや状況に応じて調整できます。

  2. アラーム遅延を設定します:

    • Zabbixのトリガー(Triggers)設定では、トリガーの「アラーム遅延」(トリガー重大度)を設定できます。

    • アラーム遅延とは、短時間に同じアラームが複数回トリガーされるのを避けるために、アラームがトリガーされた後、一定期間アラーム通知が送信されないことを意味します。

    • 特定のニーズや条件に応じて、適切なアラーム遅延時間を設定できます。

Q: ここにはこのオプションがないようです。バージョンは 5.0 です。
A: 「メッセージ送信」と「リモート コマンド」の 2 つの操作タイプを使用して、カスタマイズされたアラーム収束ロジックを実装できます。考えられる方法の 1 つを次に示します。

  1. 「メッセージの送信」アクション タイプを使用します。

    • アクション設定で、アクションの種類として「メッセージの送信」を選択します。

    • [メッセージの内容] で、送信するアラーム通知の内容を定義します。

    • トリガー条件では、トリガーの条件を設定し、条件が成立した場合にメッセージ送信動作を実行します。

    • このようにして、アラーム イベントが発生したことを通知するメッセージを送信することで、関係者に通知することができます。

  2. 「リモート コマンド」アクション タイプを使用します。

    • 動作設定では、動作タイプとして「リモートコマンド」を選択します。

    • コマンド パラメーターで、実行するカスタム スクリプトまたはコマンドを定義します。

    • トリガ条件ではトリガの条件を設定し、条件が成立した場合にリモートコマンド操作を実行します。

    • これにより、カスタム スクリプトまたはコマンドを実行してアラーム収束ロジックを処理できるようになります。

Q: メッセージの送信に関するすべてを変更しましたが、何も機能しません。アラーム メディアにカスタム メッセージを設定したため、これは効果がありません。2 番目のタイプはリモート コマンドです。ディスク、メモリなどを監視します。この種類リモートのコマンドの書き方は?

A: アクション操作の継続時間と、アラームを送信するまでの時間を定義できます。

Q: 先生、トリガーの時間を設定しました。10 分前に設定しました。10 分以内にトリガーされる限り、アラームが送信され、その後 DingTalk にメッセージを送信し続けます。メッセージは一度に数十件、監視項目は全部で3つしかなく、全て重複しているので解決したいです。

A: 「メッセージ送信」と「リモート コマンド」の 2 つの操作タイプを使用して、カスタマイズされたアラーム収束ロジックを実装できます。考えられる方法の 1 つを次に示します。

  1. 「メッセージの送信」アクション タイプを使用します。

    • アクション設定で、アクションの種類として「メッセージの送信」を選択します。

    • [メッセージの内容] で、送信するアラーム通知の内容を定義します。

    • トリガー条件では、トリガーの条件を設定し、条件が成立した場合にメッセージ送信動作を実行します。

    • このようにして、アラーム イベントが発生したことを通知するメッセージを送信することで、関係者に通知することができます。

  2. 「リモート コマンド」アクション タイプを使用します。

    • 動作設定では、動作タイプとして「リモートコマンド」を選択します。

    • コマンド パラメーターで、実行するカスタム スクリプトまたはコマンドを定義します。

    • トリガ条件ではトリガの条件を設定し、条件が成立した場合にリモートコマンド操作を実行します。

    • これにより、カスタム スクリプトまたはコマンドを実行してアラーム収束ロジックを処理できるようになります。

Q: メッセージの送信に関するすべてを変更しましたが、何も機能しません。アラーム メディアにカスタム メッセージを設定したため、これは効果がありません。2 番目のタイプはリモート コマンドです。ディスク、メモリなどを監視します。この種類リモートのコマンドの書き方は?

A: アクション操作の継続時間と、アラームを送信するまでの時間を定義できます。

Q: 先生、トリガーの時間を設定しました。10 分前に設定しました。10 分以内にトリガーされる限り、アラームが送信され、その後 DingTalk にメッセージを送信し続けます。メッセージは一度に数十件、監視項目は全部で3つしかなく、全て重複しているので解決したいです。
Q: トリガーにバインドされた項目を監視するための収集間隔はどれくらいですか?

A: 100000 は 10 時を表し、100100 は 10:01 を表します。ここで構成されたトリガー式の値は 70 以下です。

質問 4
: zabbix を使用して Tomcat を監視する方法に関するチュートリアルはありますか? zabbix に付属のテンプレートを使用します。

A:https://www.cnblogs.com/yangzhaon/p/12102794.html

質問 5Q
: Zabbix 6.0.10 centos7 システムで Zabbix 呼び出しスクリプトがタイムアウトしますが、ローカルでは実行できます。何が問題ですか?

A:

次の解決策を試すことができます。

  1. スクリプトのパスと権限を確認する: スクリプトのパスが正しいことを確認し、スクリプトに実行権限があることを確認します。

  2. スクリプト実行のタイムアウトを増やす: Zabbix サーバーまたはエージェントの構成ファイルでスクリプト実行のタイムアウトを増やすことができます。Zabbix サーバーの場合は、zabbix_server.conf ファイルで Timeout パラメータを追加または変更でき、Zabbix エージェントの場合は、zabbix_agentd.conf ファイルで Timeout パラメータを追加または変更できます。

  3. スクリプトを最適化する: スクリプトの実行時間が長すぎる場合は、スクリプト ロジックを最適化して実行時間を短縮することを検討できます。

  4. ネットワークとシステムの遅延を確認する: ネットワーク接続とシステムの負荷が正常であることを確認します。スクリプト実行のタイムアウトを増やすか、遅延の問題を解決するための他の手段を講じることができます。

質問 6
Q: zabbix 4.2.3 を使用して grafana を使用した可視化システムを構築したいのですが、zabbix 4.2.3 をベースに grafana とフローチャートのどのバージョンを使用すればよいでしょうか?

A:

Grafana バージョン: Zabbix 4.2.3 は Grafana 6.x シリーズと良好な互換性があります。Grafana 6.7.x または 6.8.x バージョンを使用できます。これらは広範囲にテストされており、Zabbix 4.2.3 と互換性があります。

フローチャート プラグインのバージョン: フローチャート プラグインを使用して、Grafana でフローチャートの視覚化を作成できます。Zabbix 公式ドキュメントによると、Zabbix 4.2.x バージョンは Flowcharting プラグイン バージョン 2.0.0 と互換性があります。したがって、フローチャート バージョン 2.0.0 を使用してフローチャートの視覚化を作成できます。

zabbix の技術的な問題については、引き続き Lewei コミュニティに注目してください。

おすすめ

転載: blog.csdn.net/weixin_43631631/article/details/133141132