HDFS読み取りおよび書き込み処理大きなデータ系列-Hadoop(B)

HDFSを導入すると、読み取りおよび書き込みプロセスを、最初のブロックのレプリカの配置戦略を導入しました。

ブロックレプリカの配置戦略

  • 最初のコピーは:データノードは、アップロードファイルを置き、それがクラスタ外に提出された場合は、ランダムに選択されたディスクは、あまり忙しくないノード、完全なCPUではありません。
  • 2番目のコピー:第1ラックの別のノードにコピーを置きます。
  • 第三にコピー:ラックノードと同じの2番目のコピー。
  • 以上のコピー:ランダムなノード。

HDFSのレプリカの配置戦略

HDFSの書き込み処理

HDFSの書き込み処理

  • クライアントが名前ノードに要求を送信し、私は、ファイルAを保存したい、この時間はA_copy(ファイルは使用できません)として識別ロゴ名前ノードがあるでしょう。
  • 配置戦略のコピーによると、場所にリストの3つのコピーを返し、デフォルトでは良いオーダーの一種です。
  • クライアントとの接続にDN1 DN2、DN2及びDN3に従った後、(DN1と呼ばれている時間のために)最も近いデータノード接続を接続するためのイニシアチブ。(シリーズパイプライン)
  • クライアントは、小さな切り傷を作るために、ソースファイル、ブロックを読み込み、
    • 最初:最初の小さなパケットをブロックDN1で最初のパス。
    • 第二:第二のブロック小さなパケットDN1の最初のパスは、同時に、最初のパケットのDN1は、DN2に渡されます。
    • 第三:第三の小DN1をブロックするために最初のパケットを送信し、同時に、DN1第2小パケットはDN2、DN3送信DN2第1の小パケットに送信されます。
    • 等々

(ブロックは小さなパケットをカットするので、この設計の利点が重ならない時間です。あなたはカットしていない場合は、このような1回の転送64Mとして、渡さDN1、待って、転送DN2は、待ち続けたときに、渡しDN3、待って、便益の時間加算を浪費するときノードを追加する場合、時間)はほとんど影響を及ぼしません

  • 最後に、データノードと名前ノードのハートビートは、通知ファイル転送が完全に終了しているかどうか、メタデータの完全な名前ノードの位置情報を入力します。

HDFSの読み取り処理

HDFSの読み取り処理

  • クライアントは、クライアント(例えば、ファイルAに通知し、ファイルの名前ノードのメタデータが発見され、名前ノードにリクエストを送信し、5ブロック、ブロック1のメタファイルレコードに切断した:DN1、DN2、DN3、ブロック2:DN1、DN4、 DN5などなど)
  • ブロックがDataNodesに直接クライアントデータを要求する(距離優先に従ってください)
  • ローカルブロックをダウンロードするすべてのバックした後、各ブロックのメタ情報のMD5認証を行います。各ブロックが正しい場合、破壊された最終文書が戻って復元され、ステッチ始まっていません。

HDFSのファイルのパーミッション

  • Linuxのファイルのパーミッションと同様の
    • R:リード、W:書き込み; X:実行
    • Xフォルダのファイルのアクセス権を無視するように対応して、そのコンテンツへのアクセスを許可するかどうかを示します
  • Linuxシステムのユーザーは、Hadoopの名を使用してファイルを作成するzhangyongli場合は、HDFSの所有者のファイルがzhangyongliです
  • 間違って何かをする善良な人々を防ぐのではなく、悪い人は、悪いことをやる防ぐために、HDFSのパーミッションの目的、。HDFSは、あなたが私はあなたが誰であるかと思いますが、あなたが誰であるかを教えて、と信じています。

説明:

  • 善良な人々が間違った行い停止します。例えば、二人のユーザーABを、ユーザーがファイルXを作成し、B YのユーザーはX. Bは、ユーザがユーザのファイルを削除することはできません、ファイルを作成します
  • 防止の悪い人は、悪いことを行います:AB悪者に2人のユーザーは、新しいLinuxシステムをインストールした場合、ユーザーAB、完了Hadoopの展開ファイルの内容は、クライアントプログラム、そしてA名前ノードで新しいシステムに移動を作成しますX名前ノードとパッシブは、信頼できるので、将来的には、この動作を防止するためにKerberosを統合する必要がある、ファイルを削除します。
    (ソースの転送を記入してください:http://www.cnblogs.com/zhangyongli2011/間違っている場合は、メッセージを残してください、ありがとうございました)

おすすめ

転載: www.cnblogs.com/zhangyongli2011/p/10897766.html