分布式存储系统学习笔记(一)—什么是分布式系统(4)—容错机制 - 代码天地

分布式存储系统学习笔记(一)—什么是分布式系统(4)—容错机制

其他 2018-10-31 01:51:29 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/kevin_zhao_zl/article/details/79198071

a) 故障检测

首先明确心跳是不是和用来进行故障检测的。在系统运行中可能出现各种错误，机器A收不到机器B的心跳包并不能认为B发生了故障并停止了服务，比如A和B之间的网络发生了故障，或者B过于繁忙无法响应A的心跳包。这就可能导致不一致问题的发生。

故障检测的关键在于两台机器对“机器B是否被认为发生故障且停止服务达成一致”，然而异步网络中的多台机器无法达成一致，但是实践中机器之间会进行时钟同步，我们假设两台机器之间本地时钟相差不大（比如小于0.5s），我们可以通过租约（Lease）机制进行故障检测。

租约机制是带有超时时间的授权，B从A处获得租约，只有在租约有效期内B对外提供服务，正常情况下，B不断向A请求租约以保证提供服务，但是当发生故障时，B无法获得新的租约，也就不能对外提供服务了。B上的数据可以进行迁移。但是考虑到本地时钟不一致的问题，A可以在租约超时时间+1s(提前量)时再认为B已经发生故障，

b) 故障恢复

对于单层结构，总控节点选择其他最新的副本代替故障节点上的副本对外提供服务，在等待一定时间后(比如1h)，总控节点认为该节点永久下线，进行副本复制以保证每一个数据分片的副本数保持在一定数目。

对于双层结构，存储和服务分开，每个数据分片同一时间只有一个节点对外提供服务。当一个节点出现故障时，总控节点选择另外一个节点，加载A的服务并从底层分布式文件系统中加载A的数据到内存中。

总控节点也可能发生故障，为此，总控节点的状态会实时同步到备机，故障发生时，通过某个外部的高可用服务选举一个备机为总控节点。

猜你喜欢

转载自blog.csdn.net/kevin_zhao_zl/article/details/79198071

分布式存储系统学习笔记(一)—什么是分布式系统(4)—容错机制

分布式存储系统学习笔记(一)—什么是分布式系统(2)—数据分布

分布式存储系统学习笔记(一)—什么是分布式系统(5)—可扩展性

分布式存储系统学习笔记(一)—什么是分布式系统(3)—复制

分布式存储系统学习笔记(一)—什么是分布式系统(1)—基本概念

分布式存储系统学习笔记(一)—什么是分布式系统(7)—跨机房部署的三种方案

分布式存储系统学习笔记(一)—什么是分布式系统(6)—2PC和Paxos协议

分布式存储系统学习笔记(二)—分布式文件系统(3)—Facebook文件系统(Haystack)

分布式存储系统学习笔记(二)—分布式文件系统(2)—淘宝文件系统(TFS)

分布式存储系统学习笔记(二)—分布式文件系统(1)—Google文件系统GFS

分布式存储系统学习笔记(三)—分布式键值系统(2)—淘宝Tair

分布式存储系统学习笔记(三)—分布式键值系统(1)—Amazon Dynamo

什么是分布式存储系统？

分布式存储系统学习笔记(二)—分布式文件系统(4)—内容分发网络(CDN)

大规模分布式存储系统笔记一

分布式系统学习笔记

Ceph分布式存储系统

分布式存储系统 Ceph

MFS分布式存储系统

GlusterFS分布式存储系统

RDMA分布式存储系统

分布式存储系统-HDFS

分布式存储系统简介

Hadoop---(4)HBase（分布式存储系统）

分布式系统学习笔记（一）

HDFS分布式存储系统笔记整理

大规模分布式存储系统笔记二

分布式存储系统（一） - 概念

大规模分布式存储系统笔记一二章概述与单机存储系统

浅谈分布式存储系统的数据分布算法

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)