数据复制与一致性

数据复制与一致性

    学习了下CAP、BASE、ACID等基本原则对于深入理解分布式环境下技术方案设计选型具有重要的指导作用。通过《大数据日知录》这本书的学习,让我对这些定有了更深的理解。这里博客做一下笔记及加深印象。
   
一 CAP
   CAP是对“Consistency/Availability/Partition Tolerance”的一种简称, 分别代表强一致性、可用性、分区容忍性。
  
   强一致性:即在分布式系统中的同一数据多副本情形下,对于数据的更新操作体现出的效果与只有单份数据是一样的
   可用性: 客户端在任何时刻对大规模数据系统的读/写操作都应该保证在限定延时内完成
   分区容忍性: 在大规模分布式数据系统中,网络分区现象,即分区间的机器无法进行网络通信的情况下是必然会发生的,所以系统应该能够在这种情况下仍然进行工作

   对于一个大规模分布式数据系统来说,CAP三要素不可兼得,同一个系统至多只能实现其中的两个,而必须放宽第3个要素来保证其他两个要素被满足。即要么AP,要么CP,抑或AC,但是不存在CAP。 这就是CAP原则的精髓所在。 一般在网络环境下,运行环境出现网络分区是不可避免的,所以系统必须具备分区容忍性特性,于是一般在此种场景下设计大规模分布式系统时,加构师往往在AP和CP中进行权衡和选择,有所强调,有所放弃。

二 ACID
   ACID是关系数据采纳的原则,也是一种简称,
   Atomicity原子性:是指一个事务要么全部执行,要第完全不执行。也就是不允许一个事务只执行了一半就停止。
   Consistency一致性:事务开始和结束时,应该始终满足一致性约束条件。
   Isolation事务独立: 如果有多个事务同时执行,彼此之间不需要知晓对方的存在,而且执行时互不影响,不允许出现两个事务交错,间隔执行部分的情形,也即事务之间需要序列化执行。
   Durability持久性: 事务的持久性是指事运行成功以后,对系统状态的更新是永久的,不会无缘由地回滚撤销。


三 BASE原则
   数据系统采纳ACID原则,获得高可靠性和强一致性。而大多数大数据环境下的云存储系统 和NoSQL系统则采用BASE原则,这种原则与ACID原则差异很大,具体而言,BASE原则是指:
   Basically Available 基本可用: 在绝大多数时间内系统处于可用状态,允许偶尔的失败,所以称为基本可用。
   Eventual Consistency 最终一致性: 与强一致性相比,最终一致性是一种弱一致性,尽管软状态不要求任意时刻数据保持一致同步,但是最终一致性要求在给定时间窗口内数据会达到一致状态。

    BASE原则与ACID原则不同,前者通过牺牲强一致性来获得高可用性。尽管现在大多数的NoSQL系统采用了BASE原则,但是有一点值得注意:NoSQL系统与云存储系统的发展过程正在向逐步提供局部ACID特性发展,即从全局而言符合BASE原则,但是从局部支持ACID原则。这样就可以及收两者各自的好处,在两者之间建议平衡。  

猜你喜欢

转载自aishu.iteye.com/blog/2360804