HDFS写入过程客户端奔溃怎么处理?(租约恢复)

  客户端崩溃时,便不可以周期性地更新租约,此时namenode便可以感知到。

  当数据写入过程中客户端异常退出时,同一数据块的不同副本可能存在不一致的状态,选择某一副本作为主数据节点,协调其他数据节点,将该数据块恢复到他们中的最小长度。数据块恢复配合租约恢复时HDFS中故障恢复的重要机制。

  lease recovery 算法:

  1.NameNode查找lease信息。
  2.对于客户端lease中的每个文件f,令b为f的最后一个block,做如下操作:
  a.获取b所在的datanode列表。
  b.令其中一个datanode作为primarydatanode p。
  c. p从namenode获取最新的时间戳。
  d. p从每个datanode获取block信息。
  e. p计算最小的block长度。
  f. p用最小的block长度和最新的时间戳来更新具有有效时间戳的datanode。
  g. p通知namenode更新结果。
  h.namenode更新BlockInfo。
  i.namenode从lease中删除f,如果此时该lease中所有文件都已被删除,将删除该lease。
  j.namenode提交修改的EditLog。
  k.当客户端恢复后,重新与namenode通信,此时namenode租约已删除,客户端会以append的方式继续写入即可。 

猜你喜欢

转载自my.oschina.net/134596/blog/1807449
今日推荐