MySQL MVCC机制

首先简单说说事务

事务必须保证ACID（原子性、一致性、隔离性和持久性），可以通过begin语句开始一个事务，然后要么使用commit提交事务将所修改的数据持久保存，要么使用rollback撤销所有修改。

再简单地介绍一下四种隔离级别。

READ UNCOMITTED (未提交读)

在READ UNCOMITTED 级别，事务中的修改，即使没有提交，对其他事务也都是可见的。事务可以读取未提交的数据，这也被称为脏读(Dirty Read)。这个级别会导致很多问题，从性能上来说，READ UNCOMMITTED 不会比其他的级别好太多，但却缺乏其他级别的很多好处，除非真的有非常必要的理由，在实际应用中一般很少使用。

READ COMMITTED (提交读)

大多数数据库系统的默认隔离级别都是READ COMMITTED (但MySQL不是)。READ COMMITTED满足前面提到的隔离性的简单定义:-一个事务开始时，只能“看见”已经提交的事务所做的修改。换句话说，-一个事务从开始直到提交之前，所做的任何修改对其他事务都是不可见的,这个级别有时候也叫做不可重复读(nonrepeatableread),因为两次执行同样的查询，可能会得到不一样的结果。

例子：当事务的隔离级别在RC级别的时候，事务A和事务B同时对数据D操作，当事务A开始的时候，读取的数据D保存下来了，这是事务B也在修改数据D，并且先于事务A提交。这是事务A再读数据D的时候，就会出现前后不一致情况，这就是所谓的不可重复读。

REPEATABLE READ (可重复读)

REPEATABLE READ 解决了脏读的问题，该级别保证了在同一个事务中多次读取同样记录的结果是一致的。但是理论上，可重复读隔离级别还是无法解决另外-一个幻读(Phantom Read)的问题。所谓幻读，指的是当某个事务在读取某个范围内的记录时，另外一个事务又在该范围内插入了新的记录，当之前的事务再次读取该范围的记录时，会产生幻行(Phantom Row)。InnoDB 和XtraDB存储引擎通过多版本并发控制(MVCC，Multiversion Concurrency Control)解决了幻读的问题。

可重复读是MySQL的默认事务隔离级别。

例子：mysql的默认事务隔离级别是RR级别的，同样是上述例子，当时不同的是当事务A和事务B开始的时候，都保存一份自己的快照，每一份快照中都有数据D的值，所以这样在同一事务中，无论重读读多少次都是正确的。

例子：在RR级别中，可能出现幻读。同样是上述例子，事务A和事务B同时查询数据D，事务A发现数据D为空，就想插入数据，但是这是事务B已经插入了数据D并且已经提交。这时事务A的提交就会出错。这是因为事务A的写操作是当前读操作。

SERIALIZABLE (可串行化)

SERIALIZABLE是最高的隔离级别。它通过强制事务串行执行，避免了前面说的幻读的问题。简单来说，SERIALIZABLE会在读取的每一行数据上都加锁，所以可能导致大量的超时和锁争用的问题。实际应用中也很少用到这个隔离级别，只有在非常需要确保数据的一致性而且可以接受没有并发的情况下，才考虑采用该级别。

   多版本并发控制（MVCC)

      MySQL的大多数事务型存储引擎实现的都不是简单的行级锁。基于提升并发性能的考虑，它们一般都同时实现了多版本并发控制(MVCC)。不仅是MySQL,包括Oracle、PostgreSQL等其他数据库系统也都实现了MVCC,但各自的实现机制不尽相同，因为MVCC没有一个统一的实现标准。

      可以认为MVCC是行级锁的一一个变种，但是它在很多情况下避免了加锁操作，因此开销更低。虽然实现机制有所不同，但大都实现了非阻塞的读操作，写操作也只锁定必要的行。

      MVCC的实现，是通过保存数据在某个时间点的快照来实现的。也就是说，不管需要执行多长时间，每个事务看到的数据都是一致的。根据事务开始的时间不同，每个事务对同一张表，同一时刻看到的数据可能是不一样的。如果之前没有这方面的概念，这句话听起来就有点迷惑。熟悉了以后会发现，这句话其实还是很容易理解的。

      前面说到不同存储引擎的MVCC实现是不同的，典型的有乐观(optimistic) 并发控制和悲观(pessimistic) 并发控制。下面我们通过InnoDB的简化版行为来说明MVCC是如何工作的。

      InnoDB的MvCC,是通过在每行记录后面保存两个隐藏的列来实现的。这两个列，一个保存了行的创建时间，一个保存行的过期时间(或删除时间)。当然存储的并不是实际的时间值，而是系统版本号(system version number)。每开始一一个新的事务，系统版本号都会自动递增。事务开始时刻的系统版本号会作为事务的版本号，用来和查询到的每行记录的版本号进行比较。下面看下在REPEATABLE READ 隔离级别下，MVCC具体是如何操作的。

      SELECT

      InnoDB会根据以下两个条件检查每行记录:

      a. InnoDB只查找版本早于当前事务版本的数据行(也就是，行的系统版本号小于或等于事务的系统版本号),这样可以确保事务读取的行，要么是在事务开始前已经存在的，要么是事务自身插人或者修改过的。

      b.行的删除版本要么未定义，要么大于当前事务版本号。这可以确保事务读取到

      的行，在事务开始之前未被删除。

      只有符合上述两个条件的记录，才能返回作为查询结果。

INSERT

InnoDB为新插人的每一行保存当前系统版本号作为行版本号。

DELETE

InnoDB为删除的每- ~行保存当前系统版本号作为行删除标识。

UPDATE

      InnoDB为插入一-行新记录，保存当前系统版本号作为行版本号，同时保存当前系统版本号到原来的行作为行删除标识。

      保存这两个额外系统版本号，使大多数读操作都可以不用加锁。这样设计使得读数据操作很简单，性能很好，并且也能保证只会读取到符合标准的行。不足之处是每行记录都需要额外的存储空间，需要做更多的行检查工作，以及一些额外的维护工作。

      MVCC只在REPEATABLE READ 和READ COMITTED 两个隔离级别下工作。其他两个隔离级别都和MVCC不兼容售4,因为READ UNCOMITED总是读取最新的数据行，而不是符合当前事务版本的数据行。而SERIALIZABLE 则会对所有读取的行都加锁。

猜你喜欢