事务最经典的例子就是转账。假如你要给朋友老王转一百，卡里刚好就一百。

牵涉的操作查询余额、加减、更新余额等必须一体化。
否则程序查完后，还没做减之前，你的100块钱，完全可借这断时间差再查一次，然后再给另外一个朋友转账。

因此就需要事务。保证一串数据库的操作，同生共死！
而在MySQL中，事务就在引擎层实现。我们就以5.5后默认的InnoDB引擎为例讲解此篇。

1 隔离性与隔离级别

事务的ACID的I - “隔离性”。

当数据库上有多个事务同时执行的时候，可能出现

脏读（dirty read）
不可重复读（non-repeatable read）
幻读（phantom read）

为了解决这些问题，就有了“隔离级别”。隔离越严，效率越低。因此要根据业务需要在二者之间寻找一个平衡点。

SQL标准的事务隔离级别如下：

读未提交（read uncommitted）
一个事务还没提交，它的变更就能被别的事务看到
读已提交（read committed）
一个事务提交后，其变更才会被其他事务看到
可重复读（repeatable read）
一个事务执行过程中看到的数据，总是跟这个事务在启动时看到的数据是一致的。
当然了，未提交的变更对其他事务也不可见。一个事务启动时，能够看到所有已提交的事务结果。但之后，这个事务执行期间，其他事务的更新对它就不可见了
串行化（serializable ）
对同行记录，“写”加“写锁”，“读”加“读锁”。
出现读写锁冲突时，后访问的事务必须等前一个事务执行完成

假设数据表T中只有一列，其中一行值1，下面是按照时间顺序执行两个事务的行为。

mysql> create table T(c int) engine=InnoDB;
insert into T(c) values(1);

按时间顺序执行两个事务的行为

不同的隔离级别下，事务A会有哪些不同的返回结果，也就是图里面V1、V2、V3的返回值分别是什么

“读未提交”
V1、V2、V3的值都是2。
“读已提交”
V1是1，V2、V3的值是2。
“可重复读”
V1、V2（事务在执行期间，即未提交前，看到的数据前后必须一致。）是1，V3是2。
“串行化”
事务B执行“将1改成2”时，会被锁住。直到事务A提交后，事务B（后访问的事务）才可继续执行。
所以从A的角度看， V1、V2值是1，V3的值是2。

在实现上，数据库里面会创建一个视图，访问的时候以视图的逻辑结果为准。

“可重复读”
视图在事务启动时创建，整个事务存在期间都用该视图。
“读提交”
视图在每个SQL语句开始执行时创建。
“读未提交”
直接返回记录上的最新值，没有视图概念
“串行化”
直接加锁来避免并行（同时，注意非并发的同时间段）访问。

Oracle数据库的默认隔离级别是“读提交”，因此对于一些从Oracle迁移到MySQL的应用，为保证数据库隔离级别的一致，要记得将MySQL的隔离级别设置为“读提交”。

2 配置方式

将启动参数transaction-isolation的值设置成READ-COMMITTED。你可以用show variables来查看当前的值。

show variables like 'transaction_isolation'

各个隔离级别都有它自己的使用场景，必须根据业务来定。

3 何时使用“可重复读”

假设你在管理一个个人银行账户表。一个表存了每个月月底的余额，一个表存了账单明细。
这时候你要做数据校对，也就是判断上个月的余额和当前余额的差额，是否与本月的账单明细一致。
你一定希望在校对过程中，即使有用户发生了一笔新的交易，也不影响你的校对结果。
这时候使用“可重复读”隔离级别就很方便。
事务启动时的视图可以认为是静态的，不受其他事务更新的影响。

4 事务隔离的实现

在MySQL中，实际上每条记录在更新时都会同时记录一条回滚操作。
记录上的最新值，通过回滚操作，都可以得到前一个状态的值。

4.1 示例

假设一个值从1被按顺序改成了2、3、4

在回滚日志里的记录。

当前值4，但在查询这记录时，不同时刻启动事务有不同read-view。
在视图A、B、C，该记录的值分别是1、2、4，同一记录在系统中可以存在多版本，就是数据库的多版本并发控制（MVCC）。

对read-view A，要得到1，就必须将当前值依次执行图中所有的回滚操作得到。
即使现在有另外一个事务正在将4改成5，这个事务跟read-view A、B、C对应的事务是不会冲突的。

何时删除回滚日志

不需要的时候才删除。即系统会自己判断，当没有事务再需用到这些回滚日志，回滚日志就会被删除。

何时不需要？

当系统里没有比该回滚日志更早的read-view时。

5 避免长事务

长事务意味着系统里面会存在很老的事务视图。由于这些事务随时可能访问数据库里面的任何数据，所以这个事务提交之前，数据库里面它可能用到的回滚记录都必须保留，导致大量占存储。

在MySQL 5.5及以前，回滚日志是跟数据字典一起放在ibdata文件，即使长事务最终提交，回滚段被清理，文件也不会变小。

除了对回滚段影响，长事务还占用锁资源，可能拖慢全库。

6 事务启动方式

开发同学并不是有意长事务，通常误用。

MySQL的事务启动方式有以下几种：

6.1 显式启动事务

begin 或 start transaction。配套的

提交语句 commit
回滚语句 rollback

6.2 set autocommit=1

set autocommit=0

将该线程的自动提交关闭。如果你只执行一个select，事务就启动了，且不会自动提交。
该事务会持续存在，直到主动执行commit 或 rollback，或断开连接。

有些客户端连接框架会默认连接成功后先执行

set autocommit=0

导致接下来的查询都在事务中，若是长连接，就导致意外的长事务。
因此建议总用

set autocommit=1

显式启动事务。

频繁事务的业务，第二种方式每个事务在开始时都不需要主动执行一次 “begin”，减少了语句交互次数。如果你也有这个顾虑，建议使用commit work and chain。

autocommit为1时，用begin显式启动的事务，若执行commit，则提交事务。
若执行 commit work and chain，则是提交事务并自动启动下个事务，省去执行begin语句的开销。从程序开发的角度也能明确知道每个语句是否处于事务。

7 查询长事务

information_schema库的innodb_trx表中查询长事务

查找持续时间超过60s的事务。

select * from information_schema.innodb_trx where
TIME_TO_SEC(timediff(now(),trx_started))>60

8 日备 V.S 周备

好处是“最长恢复时间”更短。

一天一备
最坏情况下需要应用一天的binlog。比如，你每天0点做一次全量备份，而要恢复出一个到昨天晚上23点的备份
一周一备
最坏情况就要应用一周的binlog啦！

系统的对应指标是RTO（恢复目标时间）。
当然这个是有成本的，因为更频繁全量备份需要消耗更多存储空间，所以这个RTO是成本换来的，需要根据业务评估。

9 避免长事务对业务的影响

9.1 应用开发端

确认是否使用

set autocommit=0

确认可在测试环境中，把MySQL的general_log开启，随便跑个业务逻辑，通过general_log确认。
一般框架如果设置该值，也会提供参数来控制，目标就是把它改成1。

确认是否有不必要的只读事务。有些框架不管什么语句先begin/commit框。有些是业务并没有这需要，但也把好几个select语句放到事务。这种只读事务可以去掉。

业务连接数据库时，根据业务预估，通过SET MAX_EXECUTION_TIME命令，控制每个语句执行最长时间，避免单语句意外执行太长时间。

9.2 数据库端

监控 information_schema.Innodb_trx表，设置长事务阈值，超过就报警/或者kill。

Percona的pt-kill这个工具不错，推荐。

在业务功能测试阶段要求输出所有的general_log，分析日志行为提前发现问题。
使用的MySQL 5.6或更新版本，把innodb_undo_tablespaces设置成2或更大值。如果真的出现大事务导致回滚段过大，这样设置后清理起来更方便。

你真的懂MySQL的事务隔离机制吗？