Cephシステムアーキテクチャと基本概念

Cephシステムアーキテクチャと基本概念
Cephは、優れたパフォーマンス、信頼性、およびスケーラビリティを実現するように設計された、統合された分散ストレージシステムです。

「統合」とは、Cephストレージシステムがオブジェクトストレージ、ブロックストレージ、ファイルシステムストレージの3つの機能を同時に提供できることを意味します。これにより、さまざまなアプリケーションのニーズを満たすことを前提に、導入と運用、メンテナンスを簡素化できます。

「分散」とは、Cephシステムが本当に分散化されており、システムスケールのスケーラビリティの理論的な上限がないことを意味します。実際には、Cephは数千のサーバーにデプロイできます。


著者:若い劉、

この作品は、Creative Commons Attribution-Non-Commercial Use-Share 3.0 Unlocalized Version License Agreementの下で同様にライセンスされています。

この記事へのリンクは次のとおりです:http://blog.csdn.net/younger_china/article/details/76794987


システムアーキテクチャ
Cephのシステムアーキテクチャは3つのレベルで構成されています。最下位のコア部分はRADOSオブジェクトストレージシステム、2番目のレイヤーはlibradosライブラリレイヤー、最上位のレイヤーはCephのさまざまな形式のストレージインターフェイス実装に対応しています。

最下層は、ceph-osdバックグラウンドサービスプロセスとceph-mon監視プロセスを含むRADOS(信頼性の高い自律分散オブジェクトストア)に基づいています。

中間層のlibradosライブラリは、RADOSオブジェクトストレージシステムにローカルまたはリモートでネットワーク経由でアクセスするために使用されます。

最上位層は、アプリケーションに3つの異なるストレージインターフェイス(ブロックストレージインターフェイス、オブジェクトストレージインターフェイス、ファイルシステムインターフェイス)を提供します。ファイルシステムのメタデータサーバーMDSは、メタデータアクセスを提供するために使用されます。libradosライブラリを介してデータに直接アクセスします。

cephシステムには2つのオブジェクト概念があります。1つはRGWのオブジェクトストレージで、もう1つはCephのバックエンドに格納されたオブジェクト(以下、Radosオブジェクトと呼びます)です。2つは区別する必要があります。前者はユーザー指向とユーザー指向です。インターフェースがアクセスできるオブジェクト。後者はcephサーバーによって操作されるオブジェクトです。

Rados
RADOSは主に2種類のノードで構成されています。1つはデータストレージとメンテナンス機能を実行する多数のOSD(オブジェクトストレージデバイス)であり、もう1つはシステム状態の検出とメンテナンスを実行する複数のモニターです。

モニター

モニターは、独立してデプロイされたデーモンプロセスです。高可用性を確保するために監視クラスターを形成する。モニタークラスターは、Paxosアルゴリズムを通じて独自のデータの整合性を実現します。ストレージシステム全体のノード情報などのグローバル構成情報を提供します。
OSD


 OSDは、物理ストレージを担当するデーモンプロセスです。その機能は、データを保存し、データレプリケーション、リカバリ、バックフィル、およびリバランシングを処理し、他のOSDデーモンのハートビートをチェックすることにより、監視情報をCephモニターに提供します。Cephストレージクラスターが2つのコピーを持つように設定されている場合、クラスターがアクティブ+クリーン状態に到達するには、少なくとも2つのOSDデーモンが必要です。

基本的な概念
Cephクラスターには、radosオブジェクト、OSD、PG、PGP、プール、ファイル、rbd、rgwオブジェクトなど、いくつかの基本的な概念があります。これらの基本的な概念は、Cephクラスター全体の論理アーキテクチャーを形成します。

ラドスオブジェクト

オブジェクトはデータストレージの基本単位であり、通常はデフォルトサイズの4MBです。
オブジェクトは次の3つの部分で構成されます。
(1)オブジェクトID(ID):オブジェクトを一意に識別します。
(2)オブジェクトデータ:ローカルファイルシステム内のファイルに対応し、ファイルにオブジェクトデータが保存されます。
(3)オブジェクトメタデータ:Key-Value(キーと値のペア)の形式で、ファイルに対応する拡張属性に保存できます。
OSD(オブジェクトストレージデバイス)


OSDは物理ストレージを担当するプロセスであり、通常はディスクに1つずつ対応するように構成されており、ディスクがOSDプロセスを開始します。(詳細な機能については、前の紹介を参照してください)
関係の説明:
(1)1つのOSDに複数のPGを配布できます
(2)OSDデバイスは、radosオブジェクトを格納するキャリア
PG(配置グループ)です

PGは、OSD上のロジックのレイヤーであり、論理的な概念と見なすことができます。名前から、PGはオブジェクトのコレクションである配置戦略グループであることがわかります。コレクション内のすべてのオブジェクトは同じ配置戦略を持っています。オブジェクトのコピーは同じOSDリストに配布されます。
関係の説明:
(1)PGにはマスターとスレーブがあります。複数のコピーの場合、PGのマスターコピーとスレーブコピーは異なるOSDに配布されます。
(2)オブジェクトは1つのPGにのみ属することができ、PGには多くのオブジェクト
( 3)のリストに対応するOSDためPGに格納されている全てのオブジェクトのリストに対応するPG OSD ここでの目的は、radosオブジェクトではなくユーザオブジェクトのうち、プール


プールは、PGの上のロジックレイヤーである抽象ストレージプールであり
、データの冗長性のタイプと対応するコピー配布戦略を指定します。現在、2種類のプールが実装されています。複製タイプと消去コードタイプです。
関係の説明:
(1)プールは複数のPGで構成され、PGは1つの
プールにのみ属することができます(2)同じプール内のPGは同じタイプを持ちます。たとえば、プールがコピータイプの場合、プール内のすべてのPG複数のコピーを
持つPGP(Placement Group for Placemen)

PGP「Learning Ceph」についての紹介はあまりありません。


PGPは配置目的の配置グループであり、配置グループの総数(pg_num)と同じに保つ必要があります。Cephプールの場合、配置グループの数、つまりpg_numを増やす場合は、pgp_numもpg_numと同じ整数値に増やして、クラスターが再調整を開始できるようにする必要があります。アンダーカバーの再調整メカニズムは、次の方法で理解できます。pg_num値は、OSDにマップされるプレースメントグループの数を定義します。pg_numがいずれかのプールで増加すると、このプールのすべてのPGは半分に分割されますが、それらはすべて親OSDにマップされたままです。このときまで、Cephはリバランスを開始しません。これで、同じプールのpgp_num値を増やすと、PGが親から他のOSDに移行し始め、クラスターの再調整が始まります。この方法では、
基本的な意味は次のとおりです。


1. PGPはPGをリセットする役割を果たします。2。PGP
の値はPGと同じである必要があります。PGの値が増加する一方で、2つの値を同じに保つためにPGPの値も増加する必要があります
。3。 POOLのPGが増加しても、Cephはリバランスを開始しません。PGPの値が増加した後にのみ、PGは他のOSDへの移行を開始し、
ファイルのリバランスを開始します

ファイルはファイルシステムの概念です
。cephファイルシステムは、メタデータストレージプールとデータストレージプールに基づいて構築された論理システムです。ファイルシステム内のファイルは、libcephfsとRADOSを介してオブジェクト(radosオブジェクト)にマッピングされ、クラッシュ計算を使用して検索されますストレージデバイス内の場所。
RBD(無線ブロックデバイス)

RBDはcephブロックデバイスです
。RBDイメージは、ストレージプール上に構築された論理ストレージシステムです。RBDイメージは、librbdおよびRADOSを介してオブジェクト(radosオブジェクト)にマップされ、クラッシュ計算を使用してストレージデバイス内の場所を特定します。
Rgwオブジェクト

Rgwオブジェクト。通常、ドキュメント、画像、ビデオファイルなどを指します。ユーザーはディレクトリを直接アップロードできますが、cephはディレクトリ階層に従ってRgwオブジェクトを保存しません。すべてのRgwオブジェクトはフラットです。Rgwオブジェクトは
libradosおよびRADOSによってマッピングされますオブジェクト(radosオブジェクト)をクリックし、クラッシュ計算を使用してストレージデバイス内の場所を特定します。
ここでは基本的な概念を紹介します~~~

著者:若い劉、

この作品は、Creative Commons Attribution-Non-Commercial Use-Share 3.0 Unlocalized Version License Agreementの下で同様にライセンスされています。

この記事へのリンクは次のとおりです:http://blog.csdn.net/younger_china/article/details/76794987


————————————————
著作権に関する声明:この記事は、CSDNブロガー「YoungerChina」によるオリジナルの記事であり、CC 4.0 BY-SAの著作権契約に従い、元のソースリンクとこの声明を添付して転載してください。
元のリンク:https://blog.csdn.net/younger_china/article/details/76794987

13件の元の記事を公開 Likes6 訪問者10,000以上

おすすめ

転載: blog.csdn.net/majianting/article/details/103024816