キビモニタリングシステム:OpenFalconはエンタープライズクラス、高可用性、スケーラブルなオープンソース監視ソリューションです。
まず、特性
①強力で柔軟なデータ収集
自動検出、ハヤブサのエージェントをサポートし、SNMPは、積極的に、カスタムプラグインのサポート、(タイムスタンプ、エンドポイント、メトリック、キーと値のタグ)などのopentsdbデータモデルをプッシュするユーザーをサポートしています
③アラームポリシー管理、効率的な
データ収集、アラームの判断、履歴データの保存とクエリの数百万人の各サイクルの数百をサポートしています
③アラームポリシー管理、効率的な
効率的なポータル、サポートポリシーテンプレート、テンプレートの継承とカバレッジ、複数のアラーム、サポートコールバックコール
④人道的なアラーム設定
アラーム、アラームレベル、アラーム回復通知、アラームポーズの最大数、異なる時点での閾値は、メンテナンス期間をサポート
⑤高効率のグラフコンポーネント
2,000,000メトリック単一支持レポート、アーカイブ、ストレージ(1分のサイクル)
⑥効率的な履歴データ・クエリコンポーネント
rrdtoolの使用して、データのアーカイブ戦略、メトリック年間数百人の履歴データへの二級復帰
⑦dashboard
多次元データの表示、ユーザー定義の画面
⑧可用性
コアシングルポイントせず、システム全体、簡単な操作とメンテナンス、配備の容易さ、水平方向にスケーラブル
⑨開発言語
システムのバックエンドは、すべてgolang書き込み、ポータルおよびダッシュボードは、Pythonで書かれました。
第二に、構造
各サーバーのインストール・ファルコンエージェント。golangハヤブサのエージェントは、スタンドアロン発見のコレクションからデーモンプログラムの開発、各種のデータや評価指標です。限りハヤブサのエージェントがインストールされ、機械が自動的に指標を収集し、報告するためのイニシアチブは、任意の構成のサーバーを行うには、ユーザを必要としません。サーバー側の大きな圧力が、オープン・ファルコンスタンドアロンサーバーコンポーネントのパフォーマンスが十分に高いが、そう自動的に十分なデータを収集し、水平方向に拡張することができますが、より便利でSRE DEVは、その後、問題をトレースします。
さらに、ファルコン・エージェントは、プロキシゲートウェイを提供し、容易にHTTPインターフェースを介して、機械ゲートウェイにデータをプッシュすることができ、ユーザは、ゲートウェイサーバエンド前進を助けるために効率的であろう。
第三に、データモデル
メトリックは、エンドポイント、キー値タグの複数のセット:オープンファルコンは、同じデータフォーマットとopentsdbを使用します。
{
メトリック:load.1min、
エンドポイント:オープンハヤブサのホスト、
タグ:SRV =ハヤブサ、IDC = AWS-SGP、グループ= AZ1、
値:1.5、
タイムスタンプ:date +%s
、
counterType:GAUGE、
ステップ:60
}
第四に、データ収集
1、転送、クライアントから送信されたデータを受信し、構造化データを行います。一貫性は、複数のバックエンドシステムにハッシュ・アルゴリズム、データの断片化、および転送を転送します。
図2は、転送インターフェースJSONRPC用のTelnetインターフェイスを提供します。転送は、高い転送性能が毎分5万人を超えるデータを転送することができますが、1つまたは2つが影響されることはありません以上のことをハングアップする、ステートレスです。
3、転送のためのビジネスのバックエンドサポートは、裁判官、グラフ、opentsdbを持っています。グラフの高性能データストレージ、アーカイブ、クエリコンポーネント;高性能の裁判官アラームアセンブリを決定しopentsdbは、オープン時系列データ・ストレージ・サービスです。
図4に示すように、転送データソースは以下のとおりです。
基本的な監視データの1.falconエージェント取得
2.falconエージェントは、プラグを返したユーザ定義データを行います
3.client図書館:オンラインサービスシステムは、各業務システムのQPS RPCインターフェイスのため、統一perfcounter.jarを使用して埋め込まれており、買収はレイテンシを報告するためのイニシアチブをとるだろう
注:上記の3件のデータが第1の機械プロキシゲートウェイに送信し、次に転送するためにゲートウェイによって転送されます。
五、警告アラーム
1、アラーム決意は、組み立てが完了したことを判断します。ユーザーのWebポータルの構成関連のアラートポリシー、MySQLでの保管。MySQLでハートビートサーバのコンテンツを定期的にロードされました。裁判官はまた、定期的に、関連するアラーム戦略を得るために、通信とハートビートサーバーを維持します。
2は、心拍MySQLの中のローディング内容に加えを切断、警察の行動、ホストグループのテンプレートおよびバインディングをカバーし、アイテムをカバーするテンプレートの継承、テンプレートに基づいて行われます、判断するために使用するコンポーネントを提供するために、各エンドポイントの戦略に関連した最後のアラームを計算します。
3、アラーム条件が満たされた場合、アラームがアラームに送信され、その後、テキストメッセージを電子メールで送信、チャット、米の他の形態は、ユーザに通知するために、ユーザが事前に設定を実行することができ、各裁判官に転送されたデータは、判決に関連するポリシーがトリガされます移します良いコールバックアドレス。
図4に示すように、ユーザは柔軟などのn倍の条件が異なる期間で満たさ、異なる閾値である、アラーム決意ポリシーを設定することができ、メンテナンスサイクルは無視され、等です。うねりは、クラスの決意とアラームをダンプサポートもあります。
六、API
1、すばやく達成するために、グラフAPIとコンポーネントのグラフに格納されたデータを読み出します。
図2に示すように、グラフコンポーネントへの転送データが受信された将来のグラフデータに転送され、それはデータのアーカイブを格納し、RPCインターフェイスへのアクセスを提供する方法をrrdtoolのであろう。
3の後、APIのエンドユーザー指向のクエリ要求を受信し、それは別のメトリックからの照会グラフ・データでより多くを行く、統一要約がユーザに返さ。
七、ダッシュボードダッシュボード
ダッシュボードのホームページは、ユーザーが報告されたエンドポイントに関連付けられたタグに応じて検索することができるリストをエンドポイントするために複数のディメンションを検索することができます。
図1に示すように、ホストグループ管理とサービスは、サービスのうち木、木のノード装置と組み合わせることができ、関連するテンプレートが自動的に関連付けられ又は除去されます。組立ラインオフ手動で監視するサービスを変更する必要はありません。
2、テンプレートと結合した後、継承ポリシーの適用範囲、テンプレート、ホストグループをサポートし、マシンの下のホストグループは、自動的にテンプレートのすべてのポリシーを適用します。
3、あなたはまた、シーンエンドポイントマシン名の監視の目的を達成するための式を書くことができる非常に便利ではありません。
八、ストレージストレージ
図1は、監視システムのデータ量は、複数の動作、高効率を必要とするクエリを書きます。
図面およびデータマイニングのための用途に応じて二種類に2、オープンファルコンデータ、。
図3に示すように、描画データ、より高速なクエリの条件のため、情報が失われることはできません。rrdtoolの概念にオープンファルコン参照、データが格納されるたびに、自動サンプリング、アーカイブ。最大、最小預金三重サンプルをサンプリング、平均サンプリングに応じて、アーカイブ戦略は、履歴データの5年間、以下の通りです。
転送は、HBaseのに演奏される4は、元のデータのために、また、書き込みデータをopentsdbする直接、転送サポートopentsdb使用することができます。