mysql的mvcc学习

标题MVCC(multi-version concurrency control):多版本并发控制

优点:
MVCC在大多数情况下代替了行锁,实现了对读的非阻塞,读不加锁,读写不冲突。

缺点:
每行记录都需要额外的存储空间,需要做更多的行维护和检查工作

实现原理:
在不考虑redo log的情况下利用undo log工作的简化过程:

序号 动作
1 开启事务
2 记录数据行数据快照到undo log
3 更新数据
4 将undo log写到磁盘
5 将数据写到磁盘
6 提交事务

1)为了保证数据的持久性数据要在事务提交之前持久化
2)undo log的持久化必须在数据持久化之前,这样才能保证系统奔溃时,可以用undo log来回滚事务

innodb中的隐藏列

innodb通过undo log保存已更新的旧版本的信息快照
innodb的内部实现中为每一行数据增加了三个隐藏列用于实现MVCC

列名 长度(byte) 作用
DB_TRX_ID 6 插入或更新行的最后一个事务的事务标识符(删除视为更新,将其标记为已删除)
DB_ROLL_PTR 7 写入回滚段的撤销日志记录(若行已更新,则撤销日志记录包含在更新之前重建行内容所需的信息)
DB_ROW_ID 6 行标识(隐藏单调自增ID)

结构

数据列 DB_ROW_ID DB_TRX_ID DB_ROLL_PTR

工作过程:

MVCC只在read commited(读提交) 和repeatable read(可重复读)两个隔离级别下工作。
read uncommitted总数读取最新的行数据,而不是符合当前事务版本的数据行。serialable串行化则会对所有读取的行加锁

select

innodb会根据两个条件来检查每行记录

innodb只查找版本DB_TRX_ID早于当前事务版本的数据行(行的系统版本号<=事务的系统版本号,可以确保数据行要么是在开始之前已经存在,要么是事务自身插入或修改过的)
行的删除版本号DB_ROW_PTR要么未定义未更新过,要么大于当前事务版本号。可以确保事务读取到的行,在事务开始之前未被删除

insert

innodb为新插入的每一行保存当前系统版本号为行版本号

delete
innodb为删除的每一行保存当前系统版本号作为行删除标识

update
innodb为插入一行新纪录,保存当前系统版本号作为行版本号,同时保存当前系统版本号到原来的行作为删除标识

学习网址:
http://mysql.taobao.org/monthly/
https://segmentfault.com/a/1190000012650596
https://cloud.tencent.com/developer/article/1368290

innodb使用的MVCC中结合了排它锁,实现了读的非阻塞

1、创建user

create table `user` (
    `id` bigint(20) not null auto_increment,
    `name` varchar(80) not null,
    primary key (`id`)
) engine=innodb auto_increment=1 default charset=utf8mb4;

2、开启第一个事务,插入三条数据

start transaction;
insert into user (name) values('zhangsan');
insert into user (name) values('zhangsan2');
insert into user (name) values('zhangsan3');
commit;

数据对应如下,后面两列用select是看不到的

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 undefined
2 zhangsan2 1 undefined
3 zhangsan3 1 undefined

3、select语句
innodb会根据以下两个条件检查每行记录,查询结果必须同时满足这两个条件
只会查询 创建时间(事务ID)小于或等于当前事务ID的行,这样可以确保当前事务读取的行,要么是在事务开始前已经存在要么是事务自身插入或修改过的

删除事务ID为undefined或者删除ID大于当前事务ID的行,这样可以确保当前事务读取到的行,在当前事务开始之前未被删除

4、delete语句

innodb会为删除的每一行保存当前系统的版本号(事务ID)作为删除标识
开启第2个事务,查询user数据

start transaction;
select * from user;//v1
select * from user;//v2
commit;

当事务ID=2的事务运行到v1语句时,执行了一条插入语句,插入语句的事务递增ID为3,此时的数据库结果为:

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 undefined
2 zhangsan2 1 undefined
3 zhangsan3 1 undefined
4 zhangsan4 3 undefined

根据查询条件限制:只会查询创建事务ID小于或等于2的行且删除事务ID为undefined或删除事务ID大于2的行。id为4的数据在执行事务2的v2时不会被检索出来,所以v1和v2的查询结果都是:

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 undefined
2 zhangsan2 1 undefined
3 zhangsan3 1 undefined

如果在事务2执行到v1语句时,事务3插入了一条数据,马上开启事务4删除ID为1的行

start transaction;
delete from user where id = 1;
commit;

此时数据如下:

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 4
2 zhangsan2 1 undefined
3 zhangsan3 1 undefined
4 zhangsan4 3 undefined

接着执行事务ID为2事务v2,只检索创建事务ID小于当前事务ID,且删除事务ID为undefined或者大于当前事务的行,查询结果为:

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 4
2 zhangsan2 1 undefined
3 zhangsan3 1 undefined

5、update语句

innodb执行update,实际上就是插入了一行记录,并保存创建时间事务ID为当前事务的ID,同时将旧的行中删除时间事务ID为当前事务ID,即添加一条新数据,同时将旧的行数据标记为删除
假设在事务2执行到v1的时候,分别执行了事务3插入和事务4删除,然后接着执行事务5更新

start transaction;
update user set name='hua' where id =2;
commit;

数据结构为:

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 4
2 zhangsan2 1 5
3 zhangsan3 1 undefined
4 zhangsan4 3 undefined
2 hua 5 undefined

接着执行事务2的V2,结果为

id name 创建时间(事务ID) 删除时间(事务ID)
1 zhangsan 1 4
2 zhangsan2 1 5
3 zhangsan3 1 undefined
MVCC的机制保证了可重复读:一个事务执行过程中看到的数据,总数跟这个事务在启动时看到的数据时一致的
对一些一致性要求不高的场景和对单一数据的操作的场景可以用MVCC,比如多个事务同时更改用户在线数,如果某个事务更新失败择重新计算后重试,直至成功。这样使用MVCC会极大地提高并发数,并消除线程锁。
mysql的mvcc和理论上的mvcc实际有所差异,mysql同一时刻只允许一个事务去操作某条数据,该条数据和一条undo log记录,是悲观锁的操作方式,而真实的MVCC的定义实际是乐观锁的操作方式,某一时刻记录可以存着很多版本。
发布了62 篇原创文章 · 获赞 11 · 访问量 8100

猜你喜欢

转载自blog.csdn.net/u013252962/article/details/98870057