分散ストレージの比較

分散ストレージの比較

一般的なオープンソースの分散ストレージシステム

全体的に比較システム

ここに画像を挿入説明

オープンソースのプロトコル仕様

GPL:製品の後に、市販のクローズドソースのソフトウェアの配布・販売として導出コードもGPLライセンスの下でソフトウェアを変更する必要があります後に変更することはできません。
GPLv2のは:総合GPLのテキストを変更するソースコード変更のテキストだけではなく、流れに従ってください公衆に開いていなければなりませんが、また、この変更のテキストを循環させるために作られた追加の変更を制限するために自分自身を許可していません。
GPLv3の:リリースされたソースコードを変更するユーザーを必要とし、また、関連するハードウェアの公表を必要とします。LGPL:よりリラックスしたGPL

TFS

TFS(淘宝網はファイルシステム)淘宝網は、現在オープンソースの外側に、小さなファイルの大容量記憶のために最適化された特殊を通して分散ファイルシステム、その内部に現像され、
TFSは必要、独自のファイルシステム記憶フォーマットを使用提供の公式クライアントの現在のバージョンにアクセスするための専用のAPIインタフェースは、次のとおりです。C ++ / JAVA / PHP。

プロパティ

1)TFSファイルシステムでは、ネームサーバがファイル・メタデータ、ホットスタンバイHAはすべてのメタデータがメモリ内にあるので、処理効率が非常に効率的で、非常に単純なシステム・アーキテクチャであり、切換機構により達成管理、管理も非常に便利です;
2)データストレージのサブノードの展開としてTFS DataServerをするだけでなく、負荷分散と冗長バックアップの機能を持って、独自のファイルシステムのおかげで、ファイルのIO性能を向上させるように、データの断片化を減らすために、小さな統合戦略がかかります。
3)TFSメタデータ情報(BLOCKID、FILEID)がファイル名に直接的にマップされて、この設計は非常にメタデータを格納するためにメモリ空間を減少させます。

利点

小さな、ランダムIO性能が比較的高いため1)ファイルが仕立て;
2)、オンライン膨張機構をサポートするシステムのスケーラビリティを向上させる;
3)ソフトRAID、システムの耐障害性とデータ復旧機能の拡張並行処理能力を達成するために、
4)支持可用性ホットスタンバイ切り替え、昇降システム;
5)クラスタの展開、からマスターを支持する、リード/スタンバイ機能を提供する主クラスタ。

短所

1)TFSは、大きなファイルを格納するのに適していない、小さなファイルの最適化を行う;
; 2)一般的な、普遍的な低アクセスするためのPOSIXインターフェイスをサポートしていません
3)をサポートしていないカスタムのディレクトリ構造とファイルアクセス制御を、
4)APIのダウンロードを通じて、パフォーマンスのボトルネックの一つのポイントがあります;
5)公式ドキュメントは非常に小さく、高い学習コストです。

シナリオ

アプリケーション1の)マルチクラスタ展開
2)基本的なストレージ変更しない
3)大量の小さなファイル
の単一のクラスタノード上に設けられた現在の公式の材料に応じて、ストレージノードは、ストレージノードの拡張として、1,000未満の単位でうまく機能することができるが、ネームサーバを発生することがパフォーマンスのボトルネックは、淘宝網のオンライン配備容量は1800TBの規模に達している(2009年のデータ)

FastDFS

FastDFS人は、分散ファイルシステムの開発、現在より活発なコミュニティです。上記のように3つのノードはシステム内に存在する:クライアント、追跡、記憶、論理の基礎となるストレージの概念によるパケットのソフトRAID10を達成するために、同じグループ内のストレージを複数配置することにより、同時IO簡単の性能を向上させるように負荷分散と冗長データを、論理的なストレージ線形の新しいグループを追加しながら、穏やかなストレージ容量の線膨張を達成。
ファイルをダウンロードし、APIの道を通じてサポートに加えて、そこに提供されているApacheとnginxのプラグインのサポートがあるが、また、外部のダウンロード方法のため直接利用できる対応するプラグイン、静的なWebリソースを使用することはできません。
現在FastDFS(V4.xの)コードの量は、おそらく、内部ネットワークモデルに、より成熟したlibevent-パーティのライブラリを使用して、複数行を6W並行性の高い処理能力を持っています。

プロパティ

1)導入トラッカーサーバーにアクセススケジューリング(負荷分散)を完了し、システム全体の中核拠点である、ストレージの監視と管理サーバ、我々は重要な役割トラッカーを見ることができ、また、システムの単一障害点を増加させました実際の試験は、代替トラッカーは、まだシステムが利用可能であることを確認することができ、完全な実行ではありませんが、見つかったもののFastDFSは、この目的のために複数の代替トラッカーをサポートしています。
2)ファイルの同期では、唯一の同期ストレージを行う前に、ソースファイルによって、ストレージサーバプッシュが現在により、ファイルの現在の一番下に、BINLOG同期的な方法を使用している他のストレージサーバーに配置されているグループと同期されていない正当スクール経験は、これはあなたが公共のインターネットを使用している場合、確かに、あなたは自分のファイルの検証メカニズムを追加する必要が破損したファイルの状況があるだろう、単一のクラスタの一部しか同期モード内部ネットワークポイントです。
3)マスターファイルからのサポートは、絵が協会の存在のために非常に適している、ストレージ上に、メインのファイルIDからのトリックをやってFastDFSは、ストレージ関連の関係を完了しました。

利点

1)システムが処理より効率的に、システムの複雑さを軽減、POSIX(ポータブルオペレーティングシステム)をサポートしない
システムのスケーラビリティ強化、オンライン容量拡張メカニズムをサポートしています)2
ソフトRAID、システムの拡張並行処理能力を達成するために)3を寛容とデータリカバリ機能障害
4)支援のマスターとスレーブのファイル、カスタム拡張機能のサポート
、5)スタンバイトラッカーサービスをシステムの可用性を向上させます

短所

HTTPをサポートしていない1)、大きなファイルは大きなファイルの記憶のためFastDFS適さない悪夢()であろう
2)ジェネリックインターフェイスPOSIXアクセスをサポートしていない、低い汎用性
公衆ネットワークを介してファイルの3)同期を、大きな遅延がありますあなたは、フォールトトレラント戦略の適切なアプリケーション実行する必要がある
ファイルの同期機構正当性チェックをサポートし、システムの可用性を低下させない)4を
5)APIのダウンロードを通じて、パフォーマンスのボトルネックの一つの点がありまし

シナリオ

1)単一のクラスタ配置の応用
2)は、実質的に貯蔵後に変更されていない
3)中小文書
)材料は、現在公式によって提供される、FastDFS 900Tの記憶容量を使用して、従来のシステムに達した、物理マシンに到達した100(50グループ
インストール手順_FastDFS
ソースパス:https://github.com/happyfish100/fastdfs

MooseFS

MooseFSは、Web管理インターフェイスを提供しながら、操作のマウント方法のFUSEによってファイルをサポートするファイルの現在の状態が保存されて見ることは非常に簡単である高可用性のフォールトトレラント分散ファイルシステムです。

プロパティ

1)図から、我々はMooseFSファイルシステムは、4つの部分から構成され見ることができます:管理サーバ、データサーバ、メタデータのバックアップサーバとクライアントの
すべてのメタデータは、システム全体の可用性を向上させるためには、管理サーバーによって管理されている2)、 MetadataBackupサーバファイルのメタデータは、タイムリーな回復のために操作ログデータを記録した
。3)データ・サーバが配備を分散させることができる、データストレージは、このようにシステム全体のパフォーマンスを向上させる、各ブロックのストレージノードに分散され、データサーバ、一方冗長性は、システムの信頼性を向上させる能力を提供する
。)4を融合することによって、クライアントを搭載することにより、システムの汎用性を高めるために、クライアント端末の開発の困難還元、POSIX同様へのアクセスを提供する
メタデータサーバ(マスタ)。個々のデータ・ストレージ・サーバーの管理を担当する、ファイルスケジューリングを読み書き、ファイル・スペースの再利用および復元
メタデータジャーナリングサーバー(metalogger):変更ログファイルのバックアップ・マスター・サーバーの責任問題にマスタサーバでの作業時間を引き継ぐために、
データ・ストレージのサーバー(chunkserver ):データが実際に物理的な複数のサーバに格納されている場合、接続管理サーバ、管理サーバオベイスケジューリング、収納スペースを提供し、データ伝送を提供するための責任であり、複数のコピーのノード、データ格納ディレクトリに、実際のデータを見ることができません

利点

1)の展開をインストールするのは簡単です、簡単な管理
2)は、システムのスケーラビリティ強化、オンライン容量拡張メカニズムをサポート
ソフトRAID、同時処理能力とフォールトトレラントデータ復旧機能の強化されたシステムを達成するために3)
4)データ復旧をより簡単に、強化システムを可用性5)ビジネス習慣を容易にするために、ごみ箱機能を持っています

短所

1)パフォーマンスのボトルネックと単一障害点の一点がある
2)メモリを消費MFSマスターノード
ファイルの3)は64キロバイト未満である、より低いストレージ使用率が

シナリオ

1)単一のアプリケーションクラスタ展開する
2)、大容量のファイルを

GlusterFS

Red Hatのオープンソースの分散ファイルシステムであり、それはそれ真にリニアなスケーラビリティ作り、その非メタデータ・サーバの設計による高い拡張性、高可用性と高パフォーマンス特性を持っているGlusterFS、総ストレージ容量PBは簡単に同時アクセスのクライアントのサポート数千人のレベルに到達することができ、クロスクラスタについて、その強力なジオレプリケーションは、クラスタシナリオの崩壊のために非常に適しているクラスタ間のデータミラーリング、複製およびサポートチェーンを達成することができます

プロパティ

1)現在、このようなファイルシステムに同じ身体へのアクセスへのアクセスなどの標準的なNFS / SMB / CIFSファイルプロトコルを介し、モードを搭載してGlusterFS FUSEをサポートしていますが、それはまた、HTTP / FTP / GlusterFSのアクセスをサポートし、AmazonのAWSサポートシステムの最新バージョンにアクセス
、リモートストレージノードを削除、追加することができ、あなたは、ストレージノードの現在の状態を使用する監視することができるSSHコマンドラインベースの管理インターフェースを介して、2)GlusterFS系
3)は、動的仮想ストレージ拡張の体積の拡大をサポートするために、クラスタノードをGlusterFS、冗長な分散にしながらジオ冗長モードで自己修復管理機能、HTTPのためのファイルのサポート、非同期転送と増分伝達特性と、モードよりも低いです

利点

1)システムは、FUSEは、複数のプロトコル経由のアクセスをマウントサポートするために、POSIX(ポータブルオペレーティングシステム)をサポートし、高い汎用性
システムのスケーラビリティ強化、2)オンライン容量拡張メカニズムをサポート
ソフトRAID、強化された並行システムを実現するために)3をトレラントデータ処理能力と回復力障害
4)の強力なコマンドライン管理、学習の削減、導入コストが
5)クラスタ全体のミラー・コピーをサポートするために、ビジネスの圧力を容易にするためによると、増加したクラスタノード
Red Hatが6)公式情報文書を専門、ファイルシステムメンテナンスを行うには、企業、品質保証バージョン

短所

1)強力な汎用性が、より多くのそれはIO処理効率に影響を与える、レベルにまたがる
2)を頻繁に読み取りおよび書き込みの下で、ジャンクファイルがディスクスペースを取る生成されます

シナリオ

マルチクラスタ展開の1)アプリケーション
2)現在の公式によって与えられる材料に応じて、大きなファイル、既存のストレージ容量GlusterFSシステムの使用を容易にPBに到達することができ

期間:

ブリック:ファイル・システム・ボリュームに割り当てられたブロック;
クライアント:ボリュームをマウントし、サービスを提供するために、
サーバ:実際のファイルが格納され、
サブボリューム:変換されたファイル・システム・ブロック;
容量:ファイルシステムボリューム最終変換後。

セファロ

CEPHは、ターゲット/ブロック/紙、設計当初によって記憶することができる障害の問題の一点が最初に解決されるように、それが開か分散ファイルシステムであるため、システムは、高可用性、パフォーマンスとスケーラビリティの特徴を有します。システムは慎重に、再び商業段階であるので、パイロット位相のファイルシステムは、高性能ファイルシステムがBTRFS(Bツリーファイルシステム)のままでサポートし、OSD方式によってストレージをサポートしながら、その性能は、非常に優れています本番環境

プロパティ

1)セファロRADOS基礎となるストレージが、図に示すように、基礎となる実施形態のストレージシステムLIBRADOS / RADOSGW / RBD / CEPHFSアクセスを提供する、)信頼性の高い、自動分散オブジェクトストレージ(に基づいている。
2)ヒューズで、セファロサポートは類似POSIXアクセス方法;セファロ分散システムは、最も重要なMDSノードが単一障害点のない複数の問題を展開することができており、大幅に向上処理性能
数変換オブジェクトダイナミック完全なファイルのiノード番号を使用して3)のCEPH CRUSHアルゴリズムさらに、ストレージファイルのメタデータ情報を回避し、システムの柔軟性を高めるために

利点

1)サポートオブジェクトストア(OSD)クラスタは、CRUSHアルゴリズムによって、完全なファイルは、動的に、より高い処理効率配置
、汎用性の高い開発コストクライアントを低減、2)FUSEを介して支持体にマウント
3)支持分散MDS / MONを単一障害点のない
)4堅牢な耐障害性と自己回復機能が5)、オンライン容量拡張と冗長性をサポートし、システムの信頼性を向上させます

短所

1)試験段階に現在ある、システムの安定性は大丈夫

シナリオ

1)アプリケーションのネットワーク全体に分散配備
2)リアルタイム、公式宣伝の高い信頼性要件は、記憶容量を容易に到達できるPBレベル
ソースパス:https://github.com/ceph/ceph

MogileFS

開発言語:perlの
オープンソースライセンスを:GPLは
、データベース依存している
データベースを担当読み、省庁間のコピー・ストレージ・データ同期として、書き込み:トラッカー(コントロールセンター)
データベース:保存するソースデータ(デフォルトのMySQL)
ストレージ:ファイルストレージ
APIに加えて、あなたはnginxのと統合することができますが外国の提供ダウンロードサービスの
ソース・パス:https://github.com/mogilefs

おすすめ

転載: blog.csdn.net/weixin_44691065/article/details/91893281