你真的懂MySQL的事务隔离机制吗?

事务最经典的例子就是转账。假如你要给朋友老王转一百,卡里刚好就一百。

牵涉的操作查询余额、加减、更新余额等必须一体化。
否则程序查完后,还没做减之前,你的100块钱,完全可借这断时间差再查一次,然后再给另外一个朋友转账。

因此就需要事务。保证一串数据库的操作,同生共死!
而在MySQL中,事务就在引擎层实现。我们就以5.5后默认的InnoDB引擎为例讲解此篇。

1 隔离性与隔离级别

事务的ACID的I - “隔离性”。

当数据库上有多个事务同时执行的时候,可能出现

  • 脏读(dirty read)
  • 不可重复读(non-repeatable read)
  • 幻读(phantom read)

为了解决这些问题,就有了“隔离级别”。隔离越严,效率越低。因此要根据业务需要在二者之间寻找一个平衡点。

SQL标准的事务隔离级别如下:

  • 读未提交(read uncommitted)
    一个事务还没提交,它的变更就能被别的事务看到
  • 读已提交(read committed)
    一个事务提交后,其变更才会被其他事务看到
  • 可重复读(repeatable read)
    一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数据是一致的。
    当然了,未提交的变更对其他事务也不可见。一个事务启动时,能够看到所有已提交的事务结果。但之后,这个事务执行期间,其他事务的更新对它就不可见了
  • 串行化(serializable )
    对同行记录,“写”加“写锁”,“读”加“读锁”。
    出现读写锁冲突时,后访问的事务必须等前一个事务执行完成

假设数据表T中只有一列,其中一行值1,下面是按照时间顺序执行两个事务的行为。

mysql> create table T(c int) engine=InnoDB;
insert into T(c) values(1);
  • 按时间顺序执行两个事务的行为

不同的隔离级别下,事务A会有哪些不同的返回结果,也就是图里面V1、V2、V3的返回值分别是什么

  • “读未提交”
    V1、V2、V3的值都是2。
  • “读已提交”
    V1是1,V2、V3的值是2。
  • “可重复读”
    V1、V2(事务在执行期间,即未提交前,看到的数据前后必须一致。)是1,V3是2。
  • “串行化”
    事务B执行“将1改成2”时,会被锁住。直到事务A提交后,事务B(后访问的事务)才可继续执行。
    所以从A的角度看, V1、V2值是1,V3的值是2。

在实现上,数据库里面会创建一个视图,访问的时候以视图的逻辑结果为准。

  • “可重复读”
    视图在事务启动时创建,整个事务存在期间都用该视图。
  • “读提交”
    视图在每个SQL语句开始执行时创建。
  • “读未提交”
    直接返回记录上的最新值,没有视图概念
  • “串行化”
    直接加锁来避免并行(同时,注意非并发的同时间段)访问。

Oracle数据库的默认隔离级别是“读提交”,因此对于一些从Oracle迁移到MySQL的应用,为保证数据库隔离级别的一致,要记得将MySQL的隔离级别设置为“读提交”。

2 配置方式

将启动参数transaction-isolation的值设置成READ-COMMITTED。你可以用show variables来查看当前的值。

  • show variables like 'transaction_isolation'

各个隔离级别都有它自己的使用场景,必须根据业务来定。

3 何时使用“可重复读”

假设你在管理一个个人银行账户表。一个表存了每个月月底的余额,一个表存了账单明细。
这时候你要做数据校对,也就是判断上个月的余额和当前余额的差额,是否与本月的账单明细一致。
你一定希望在校对过程中,即使有用户发生了一笔新的交易,也不影响你的校对结果。
这时候使用“可重复读”隔离级别就很方便。
事务启动时的视图可以认为是静态的,不受其他事务更新的影响。

4 事务隔离的实现

在MySQL中,实际上每条记录在更新时都会同时记录一条回滚操作。
记录上的最新值,通过回滚操作,都可以得到前一个状态的值。

4.1 示例

假设一个值从1被按顺序改成了2、3、4

  • 在回滚日志里的记录。

当前值4,但在查询这记录时,不同时刻启动事务有不同read-view。
在视图A、B、C,该记录的值分别是1、2、4,同一记录在系统中可以存在多版本,就是数据库的多版本并发控制(MVCC)。

对read-view A,要得到1,就必须将当前值依次执行图中所有的回滚操作得到。
即使现在有另外一个事务正在将4改成5,这个事务跟read-view A、B、C对应的事务是不会冲突的。

何时删除回滚日志

不需要的时候才删除。即系统会自己判断,当没有事务再需用到这些回滚日志,回滚日志就会被删除。

何时不需要?

当系统里没有比该回滚日志更早的read-view时。

5 避免长事务

长事务意味着系统里面会存在很老的事务视图。由于这些事务随时可能访问数据库里面的任何数据,所以这个事务提交之前,数据库里面它可能用到的回滚记录都必须保留,导致大量占存储。

在MySQL 5.5及以前,回滚日志是跟数据字典一起放在ibdata文件,即使长事务最终提交,回滚段被清理,文件也不会变小。

除了对回滚段影响,长事务还占用锁资源,可能拖慢全库。

6 事务启动方式

开发同学并不是有意长事务,通常误用。

MySQL的事务启动方式有以下几种:

6.1 显式启动事务

begin 或 start transaction。配套的

  • 提交语句 commit
  • 回滚语句 rollback

6.2 set autocommit=1

set autocommit=0 

将该线程的自动提交关闭。如果你只执行一个select,事务就启动了,且不会自动提交。
该事务会持续存在,直到主动执行commit 或 rollback,或断开连接。

有些客户端连接框架会默认连接成功后先执行

set autocommit=0

导致接下来的查询都在事务中,若是长连接,就导致意外的长事务。
因此建议总用

set autocommit=1

显式启动事务。

频繁事务的业务,第二种方式每个事务在开始时都不需要主动执行一次 “begin”,减少了语句交互次数。如果你也有这个顾虑,建议使用commit work and chain。

autocommit为1时,用begin显式启动的事务,若执行commit,则提交事务。
若执行 commit work and chain,则是提交事务并自动启动下个事务,省去执行begin语句的开销。从程序开发的角度也能明确知道每个语句是否处于事务。

7 查询长事务

information_schema库的innodb_trx表中查询长事务

  • 查找持续时间超过60s的事务。
select * from information_schema.innodb_trx where
TIME_TO_SEC(timediff(now(),trx_started))>60

8 日备 V.S 周备

好处是“最长恢复时间”更短。

  • 一天一备
    最坏情况下需要应用一天的binlog。比如,你每天0点做一次全量备份,而要恢复出一个到昨天晚上23点的备份
  • 一周一备
    最坏情况就要应用一周的binlog啦!

系统的对应指标是RTO(恢复目标时间)。
当然这个是有成本的,因为更频繁全量备份需要消耗更多存储空间,所以这个RTO是成本换来的,需要根据业务评估。

9 避免长事务对业务的影响

9.1 应用开发端

确认是否使用

set autocommit=0

确认可在测试环境中,把MySQL的general_log开启,随便跑个业务逻辑,通过general_log确认。
一般框架如果设置该值,也会提供参数来控制,目标就是把它改成1。

确认是否有不必要的只读事务。有些框架不管什么语句先begin/commit框。有些是业务并没有这需要,但也把好几个select语句放到事务。这种只读事务可以去掉。

业务连接数据库时,根据业务预估,通过SET MAX_EXECUTION_TIME命令,控制每个语句执行最长时间,避免单语句意外执行太长时间。

9.2 数据库端

监控 information_schema.Innodb_trx表,设置长事务阈值,超过就报警/或者kill。

Percona的pt-kill这个工具不错,推荐。

在业务功能测试阶段要求输出所有的general_log,分析日志行为提前发现问题。
使用的MySQL 5.6或更新版本,把innodb_undo_tablespaces设置成2或更大值。如果真的出现大事务导致回滚段过大,这样设置后清理起来更方便。

猜你喜欢

转载自blog.csdn.net/qq_33589510/article/details/107276214
今日推荐