MVCC如何实现数据库读已提交和可重复读这两种隔离级别？

文章目录

隐藏列
undo log
ReadView
读已提交和可重复读的实现

我们都知道Mysql有四种事务隔离级别：

读未提交
读已提交
可重复读
串行化

这四个隔离级别的特点就不多赘述了，这次主要聊一下MVCC(多版本并发控制)是如何实现“读已提交”和“可重复读”这两种隔离级别的。

在以往的实现中，MySql要使用读锁+写锁实现隔离级别，而使用MVCC就可以免去读操作，读操作直接基于MVCC实现，MVCC到底是啥呢？

MVCC其实主要包含三个概念：隐藏列，undo log，ReadView

隐藏列

在Innodb引擎中，每个数据表都会有两个隐藏列（其实准确来说是三个，还有一个叫隐藏id，因为innodb必须要有主键，如果建表时没有显式指定的话，就会生成这个隐藏id作为主键，当然这个隐藏id和mvcc没有关系，真正和mvcc有关系的其实是两个隐藏列），分别是trx_id,创建版本号；和roll_pointer，回滚指针。其中创建版本号其实就是创建该行数据的事务id。这些隐藏列对我们客户端来说是不可见的。

undo log

当事务对数据行进行一次更新操作时，会把旧数据行记录在一个叫做undo log的记录中，在undo log中除了记录数据行，还会记录下该行数据的对应的创建版本号，也就是生成这行数据的事务id嘛~然后将原来数据行中的回滚指针指向undo log记录的这行数据。然后再在原来数据表中进行一次更新操作，如果这次更新操作回滚了，那么就可以根据回滚指针去undo log中查找之前的数据进行复原。如果后续还有更新操作的话，就会在undo log中和之前的数据行形成一条链表，链表头就是最新的数据，这条链表就叫做版本链

（ps：数据本来是刘备，然后事务id为100的事务先修改成了关羽，再修改成了张飞，后面事务id为200的事务先修改成了赵云，再修改成了诸葛亮，）

事务的可见性都是基于这个undo log来实现的

ReadView

刚才说了更新操作，那查询操作呢？这才是实现不同隔离级别的关键地方

当进行查询操作时，事务会生成一个ReadView，ReadView是一个事务快照，准确来说是当前时间点系统内活跃的事务列表，也就是说系统内所有未提交的事务，都会记录在这个Readview内，事务就根据它来判断哪些数据是可见的，哪些是不可见的。

查询一条数据时，事务会拿到这个ReadView，去到undo log中进行判断。若查询到某一条数据：

先去查看undo log中的最新数据行，如果数据行的版本号小于ReadView记录的事务id最小值，就说明这条数据对当前数据库是可见的，可以直接作为结果集返回
若数据行版本号大于ReadView记录最大值，说明这条数据是由一个新的事务修改的，对当前事务不可见，那么就顺着版本链继续往下寻找第一条满足条件的
若数据行版本号在ReadView最小值和最大值之间，那么就需要进行遍历了整个ReadView了，如果数据行版本号等于ReadView的某个值，说说明该行数据仍然处于活跃状态，那么对当前事务不可见

读已提交和可重复读的实现

ReadView就是这样来判断数据可见性的。

那又是如何实现读已提交和可重复读呢？其实很简单，就是生成ReadView的时机不同。

对读已提交来说，事务中的每次读操作都会生成一个新的ReadView，也就是说，如果这期间某个事务提交了，那么它就会从ReadView中移除。这样确保事务每次读操作都能读到相对比较新的数据

而对可重复读来说，事务只有在第一次进行读操作时才会生成一个ReadView，后续的读操作都会重复使用这个ReadView。也就是说，如果在此期间有其他事务提交了，那么对于可重复读来说也是不可见的，因为对它来说，事务活跃状态在第一次进行读操作时就已经确定下来，后面不会修改了。

Jayicee

发布了60 篇原创文章 · 获赞 7 · 访问量 3865

私信关注