CAP学习

一、分布式系统的三个指标

  • C:数据一致性(consistency)
    • 所有节点拥有数据的最新版本(强一致性)
  • A:可用性(availability)
    • 数据具备高可用性
  • P:分区容错性(partition-tolerance)
    • 容忍网络出现分区,分区之间网络不可达,即允许发送的信息可能不可达

二、Partition tolerance

  任何网络都是不可能始终可达,一定会出现通信失败的情况,这时通信双方在网络上像被割裂开来了,形成不同分区。

  我们必须允许通信失败的情况,做到这种分区情况的容错性,因为这是无法避免的,所以三者之中必须有P,那么就是说C和A无法同时达到

三、Consistency

  一致性是指系统内部所有节点数据和状态保持一致,你在系统中一个节点中写了数据,那么可以从其他节点读到该数据。

四、Availability

  可用性是指系统中的节点应该始终能对外提供服务,保持可用。

五、Consistency 和 Availability 的矛盾

  为什么C和A不能同时达到呢?就是因为通信可能会失败(即分区容错),无法达到百分之百通信成功。

  

  如图所示,在理想情况下,client往G1写数据,然后G1立马向G2通信来同步数据,那么client之后去G2就能读到该数据,这时可以同时满足CAP了。

  但是如果通信失败,那么在当前,G1和G2就不同步达不到一致性,而如果把G2剔除或禁止G2对外提供服务直到通信成功,那么此时对于外界来说,这个分布式系统还是一致的,但这时G2就没有可用性了。

  通信失败是无法避免的,所以CAP只能最多实现其中两样,也就是C和A任选一样。

  但这个只是说严格的C和A,也就是强一致性和完全可用性无法同时达到,但一致性其实是有不同级别的:

  • 强一致性:每个节点的数据都是最新版本
  • 弱一致性:容忍部分不是最新
  • 最终一致性:放宽对时间的要求,在容忍的时间内达到一致性即可

  互联网大部分应用其实只需要高可用性和最终一致性而已,失败之后重试直到成功,那么这样最终达到了一致性以及始终的可用性,但代价是中间存在一段时间的不一致性

猜你喜欢

转载自www.cnblogs.com/liuzhugu/p/9897765.html
CAP