HBaseのトラブルシューティングのアイデア

HBCK - 何HBCKチェック!

(1)HBaseの地域の一貫性

  • すべてのクラスタ領域が割り当てあり、そして唯一のリージョンサーバーにデプロイします

  • メモリ、HBaseの中の領域の状態:メタテーブルと飼育係3ヶ所は一貫している必要があります

(2)HBaseのテーブルの整合性

  • 任意のクラスタテーブルのため、それぞれのrowKeyの領域のみに存在している区間

 

HBCK - 共通検査命令

  • ./bin/hbase hbck

  • ./bin/hbase hbck -details

  • ./bin/hbase hbck TableFoo TableBar

 

HBCK - 地元の修理のリスクが低いです

  • -fixAssignments:リージョンサーバー地域の複数の問題に割り当てる修理、アサイン不正確な割り当てたり、同時にません。

  • -fixMeta:一貫性のないメタメタデータテーブル:ファイルとHBaseの.regioninfo大修理。HDFSファイルの修復は、原理に基づいている勝つ:そこ領域HDFSにありますが、hbase.metaテーブルに存在しない場合は、HBaseの中で次のようになります。レコードのメタテーブルを追加します。HDFS上、およびHBaseのに存在しない場合一方、:メタテーブルが存在し、それがHBaseのようになります。メタテーブルに対応するレコードが削除されます。

 

HBCK - 高リスクの修復 

  • な修理などの高リスクの修復操作に関連する領域範囲の重複修正の問題は、通常、HDFS上のファイルを変更する必要があり、そして時には手動での介入が必要。

  • このような高いリスクの修復操作のためには、hbck -detailsに問題の詳細についてのより詳細な理解を実行することを推奨して、適切な修復コマンドを実行しています

  • -repair | -fixコマンドラインが強く、生産使用は推奨されていません

 

HBCK - ケース 

 

RIT処理ルーチン

  • ルーチン:pending_open(又はpending_close)状態領域は、通常、コマンドhbckを使用して修復することができます

  • 2つのルーチン:地域failed_open(またはfailed_close)状態は、通常、コマンドhbckを使用して修復することはできません

  • 3つのルーチン:領域がfailed_openログをチェックする(またはfailed_close)領域は、シャットダウンの具体的な原因の状態を確認するために開くことができません

  • 4つのルーチン:通常の状態が、hbck RITにおける領域は、関連領域のZK上の領域・イン・トランザクションのノードが削除され、マスターを再起動します

 

HBase-ログ解析

  • モニタリングと分析が唯一の原因、間接的な原因が何であるかを伝えることができます

  • ログ分析は、あなたの最も直接的な原因を、問題の正確な原因を教えてくれます。

       一般的な質問は、ログの直接の原因で発見され、その後、その理由に基づいて答えを見つけることができます。

  • あなたがその多くを教えてくれません監視、ログ分析を通じて、全体の問題をクリアすることができます

57元記事公開 ウォン称賛33 ビューに14万+を

おすすめ

転載: blog.csdn.net/u014156013/article/details/82628551