CEPH異常ハートビート機構ケース一度覚えておいてください

現象:ノードOSDを見つけるMON 900Sを待って、それは状況に来たときに、ネットワークノードまたは異常OSD、マークダウンされる例外OSDに月の遅延がある場合、大規模なクラスタでは、CEPHを使用してクラスタを展開する場合、我々はされています唯一それが更新されていないpgmap異常OSDがマークダウン、およびアップデートが広がっosdmap。しかし、900番台の中に、クライアントIOはまだOSDタイムアウトIOにつながる、異常発行行き、さらに最後のビジネスに影響を与える必要があります。

分析:
我々はまた、OSD例外に他のOSDのOSDと異常な心拍月のレポートの設立を見たログMONが、短時間にマークダウンされるこれらのOSD月を持っていません。唯一の問題を見つけるために、ネットワークや情報に関連した本の数の見直し後。
まず、我々はいくつかの関連する構成アイテムのOSD構成に焦点を当てて:
(1)osd_heartbeat_min_peers:10
(2)mon_osd_min_down_reporters:2
(3)mon_osd_min_down_reporters_ratio:0.5
クラスタノードCEPHに上記パラメータを行うことができるCEPHデーモンosd.xコンフィグショービュー(xは、IDのあなたのOSDクラスタです)。
問題の原因は何ですか?
オブジェクト心拍の確立が、CEPHの機構としてクラスターの現場に配備されたとき、各OSDがランダムに10のピアOSDの問題を選択し、この10 OSDは、必ずしもすべての異なるノード上に散布することを保証するものではありません。異常がOSD場合したがって、レポーター月レポートの確率、即ち、OSDダウン比= 0.5を満たさないクラスタストレージホストのレポーターの数ではない半分以上番号は、そうOSD異常なハートビートパケットは、OSD間のメカニズムを介して生きることができません月が見つかるまで、高速マークダウンし、このOSDのpgmapは、(それが生きているハートビートOSD最終保険を維持するためのメカニズムとして見ることができ、別のメカニズムを)異常を識別するために900S後まで更新、およびosdmapを通じて広がっていません。そして、ビジネスのために、このアッパー900Sは、それは多くの場合、受け入れられません。
しかし、小規模なクラスタのこの現象はほとんどそのような3ノードクラスタCEPHの例のように、発生しない:
CEPH異常ハートビート機構ケース一度覚えておいてください
他のノードのOSDを有するピアの数がosd_heartbeat_min_peers未満確立場合、OSDは(その近くOSDとのハートビート接続を確立することを選択していきそして、同じノード上でも自分自身。)
:OSDのハートビート・メカニズムのために、インターネットはいくつかの要件まとめた
組立ラインオフマークダウンOSDに数分以内にモニター、心拍の確立が第二級およびレポートモニタでOSDのOSDその他の異常を見つけることができます:(1)タイムリーに
(2)適切な圧力:より良いピア考えてはいけない、パブリックネットワークとクラスタネットワークを共有している特に今の実用的なアプリケーションシナリオはOSDハートビートを監視し、メッセージやネットワークリンクを送信することを、ハートビート接続が確立されるには、大幅にあまり影響を与えますシステムのパフォーマンス。月を維持する別の方法のOSDをハートビートが、キープアライブハートビートOSD間CEPHは、この圧力は、それぞれのOSDに分配され、中央ノードmonが大幅に圧力を減少させました。
CEPH異常ハートビート機構ケース一度覚えておいてください
(3)ネットワークジッタトレランス:レポートOSD後に収集した月が、待っているいくつかの条件の期間を経るのではなく、マークダウンOSDに殺到します。これらの条件のOSD有効目標時間は、一定量のosd_heartbeat_graceおよび履歴ネットワーク条件、およびホストによって報告された数によって決定された閾値よりも大きく、min_reportersはmin_reporters_ratioかどうか、および特定の時間内に、障害がソースレポート等によりキャンセルされることが報告されていません。
(4)拡散機構:実現の二種類は、不活性OSDクライアントが存在し、アクティブ拡散osdmapをもんと自身を取ります。クライアントOSDが認識されるようにタイムリーに例外やその他の情報を作成するには、かつて一般的には良く達成することです。

まとめとインプリケーション:
2つの方向の変更を行うことができます。
min_reporter_ratio 0.5は明らかに無理であるように、(1)既存のメカニズムは、*は、ハートビートホスト0.5を確立することは、どのように多くのホストハートビート(ホストの数を取る)を確立し、このOSDのOSD上で使用されるべきであり、クラスタ化されたストレージノードの数を取るため基礎として判断の総数。
(2)いくつかのシーンは、我々は、そのようなクラスタCEPH論理複数の領域を画定するように、クラッシュの階層構造を使用して、論理領域番号に格納された独自のデータを定義する、スライスのコピーまたはデータのみに存在しますロジック領域、スコープのOSDは、適切な接続を確立関連するハートビートを合理化し、正確にする必要があります。

今OSDハートビート機構CEPHは多くの問題が残って気づいた、私たちが待って見てみましょう、バックは現在のメカニズムの新しいメカニズムに置き換えられないだろうかわかりません。

おすすめ

転載: blog.51cto.com/12374206/2417781