Mysql事务详细介绍

事务是什么？

数据库事务就是访问并可能操作各种数据项的一个数据库操作序列，是一个不可分割的工作单位；事务由事务开始与事务结束之间执行的全部数据库操作组成。

事务是数据为了保证操作的原子性，隔离性，持久性，一致性，数据库提供了一套机制，在同一事务中，如果有多条sql执行，事务确保执行的可靠性。

注：mysql中只有Innodb引擎支持了事务

事务的特性

ACID：原子性Atomicity，一致性Consistency，隔离性Isolation，持久性durability；（缘一持续隔离）

1.原子性Atomicity

一个事务中的多条sql要么都执行，要么都不执行

2.持久性durability

事务提交后，对数据的修改就是永久的，即使系统故障也不会丢失。

3.隔离性Isolation

数据库允许多个并发事务同时对数据进行操作，当多个事务对数据进行操作时，我们需要不同的隔离机制(级别)进行控制，不同的隔离级别能够读到正确的数据是不一样的，防止数据的不完整。且需要保证同一时间只有一个事务在写操作。

多用于读和写操作；

事务隔离分为以下不同级别（简单介绍，下面有更为详细的说明）
读未提交，即b读到了a未提交的数据
读已提交，即b只能读到a已经提交的数据，a即使修改了，但如果还没提交，b就读不到，只能读到已经提交的数据。
可重复读：b事务相同的查询语句读到的数据永远与第一次保持一致，可以多次重复读。
串行化：一个事务一个事务进行，不会出现读脏数据、幻读、不可重复读等问题

4.一致性

数据经过很多次的操作，最终的结果要与预期的结果一致，保证数据的完整性，原子性、隔离性、持久性都是为了保证数据的一致性。

mysql设置事务处理

1.事务的自动提交与手动提交

设置自动提交：

SET GLOBAL(session) autocommit=1;

global是全局，也可以设置当前会话，global改为session即可

mysql中只有innodb支持事务，且默认是自动提交。

设置手动提交：

SET GLOBAL(session) autocommit=0;

查看事务的提交模式：

SHOW GLOBAL(session) VARIABLES LIKE 'autocommit';

2.事务的手动开启以及结束

我们设置为事务手动提交后：

通过 begin ，Rollback，Commit 实现

Begin / start transaction；开始一个事务

Rollback 事务回滚

Commit 事务提交

3.事务的四种隔离级别

为什么要有隔离级别？

MySQL 是一个服务器／客户端架构的软件，对于同一个服务器来说，可以有若干个客户端与之连接，每个客户端与服务器连接上之后，就可以称之为一个会话。我们可以同时在不同的会话里输入各种语句，这些语句可以作为事务的一部分进行处理。不同的会话可以同时发送请求，也就是说服务器可能同时在处理多个事务，这样子就会导致不同的事务可能同时访问到相同的记录。我们前边说过事务有一个特性称之为隔离性，理论上在某个事务对某个数据进行访问时，其他事务应该进行排队，当该事务提交之后，其他事务才可以继续访问这个数据。但是这样子的话对性能影响太大，所以设计数据库的大叔提出了各种隔离级别，来最大限度的提升系统并发处理事务的能力.

只有 InnoDB 支持事务，所以这里说的事务隔离级别是指 InnoDB 下的事务隔离级别。

设置事务隔离级别：

SET GLOBAL(session) TRANSACTION ISOLATION LEVEL READ UNCOMMITTED

(以读未提交举例，不同的级别我们修改即可)

1.读未提交：

即B事务读到了A事务未提交的数据

A事务读数据时，只要其他事务对数据进行修改，即使没有提交这个修改，A事务也会读到。

问题：产生脏读（即读到了垃圾数据，因为A事务可能会回滚），安全性太差，数据准确性大幅降低。

解决脏读：设置隔离级别为读已提交；

read uncommitted

2.读已提交：

即B事务读的只能是A事务已经提交的数据；

只要别的事务提交了，那么另一个事务就可以看到，每次读到的都是最新的数据。

解决了脏读问题，但会产生不可重复读问题（B事务在开启后的两次查询中，查询结果不相同），因为这个隔离级别下，无论a是否修改数据，b只能查到原本表中的数据，除非a进行事务提交，这时b再次查，查到的是新的数据，形成两次不同的数据，产生不可重复读问题

read committed

3.可重复读：

B事务在开启后的两次查询中，两次查询结果是相同的；（这个隔离级别是mysql默认隔离级别）

B事务开启后，第一次读到数据后，就定格下来，后面的读操作读到的就和这个数据一致，即使这个过程中别的事务可能已经对数据修改提交过了。所以叫做可重复读，因为你不论读多少次，都是第一次读的结果，可以重复读。

解决不可重复读问题，不会出现幻读；但如果在sql语句后加上update，可能会出现幻读。

repeatable read

一般的查询操作不会产生幻读，但如果Select .. for update会出现幻读

4.串行hang化

事务串行执行()，避免了以上所有问题；

加锁实现，只要有一个事务执行，其他事务就得等待，哪怕是读操作，也会将读到的数据锁住；

一个事务一个事务执行，安全度最高，但速度、效率太慢。

不同隔离级别会出现的问题

脏读问题、不可重复读问题，都是行级的错误，是内容方面的错误。而幻读是数据数量上的错误。

幻读的定义：两次相同的查询条件，出来的数据数量不同；事务A 按照一定条件进行数据读取，期间事务B 插入了相同搜索条件的新数据，事务A再次按照原先条件进行读取时，发现了事务B新插入的数据，这种情况称为幻读；

事务四种特性实现原理

即ACID四种特性的实现原理

MySQL 的日志有很多种，如二进制日志、错误日志、查询日志、慢查询日志等，此外 InnoDB 存储引擎还提供了两种事务日志：redolog(重做日志)和 undolog(回滚日志)。其中 redolog 用于保证事务持久性；undolog 则是事务原子性和隔离性实现的基础。即他还可以帮助实现隔离性

1.实现原子性

原子性的实现靠的是 undolog(回滚日志)

undolog：保存每次操作的反向操作，如我们执行insert操作，那么日志中保存delete操作。当会回滚时执行一个相反的update，把数据改回去

实现原子性的关键，是当事务回滚时能够撤销所有已经成功执行的 sql 语句。InnoDB 实现回滚，靠的是 undo log：当事务对数据库进行修改时，InnoDB会生成对应的 undo log；如果事务执行失败或调用了 rollback，导致事务需要回滚，便可以利用 undo log 中的信息将数据回滚到修改之前的样子。undo log 属于逻辑日志，它记录的是 sql 执行相关的信息。当发生回滚时，InnoDB 会根据 undo log 的内容做与之前相反的工作：对于每个 insert，回滚时会执行 delete；对于每个 delete，回滚时会执行 insert；对于每个 update，回滚时会执行一个相反的 update，把数据改回去。

2.实现持久性

持久性的实现靠的是 redo log(重做日志)

redo log：当执行修改数据操作时，先会将语句保存到redo log中，即使突然断电，正常后也可以通过日志恢复数据。

redo log 叫做重做日志，是保证事务持久性的重要机制。当 mysql 服务器意外崩溃或者宕机后，保证已经提交的事务，确定持久化到磁盘中的一种措施。
innodb 是以页为单位来管理存储空间的，任何的增删改差操作最终都会操作完整的一个页，会将整个页加载到 buffer pool 中，然后对需要修改的记录进行修改，修改完毕不会立即刷新到磁盘，而且仅仅修改了一条记录，刷新一个完整的数据页的话过于浪费了。但是如果不立即刷新的话，数据此时还在内存中，如果此时发生系统崩溃最终数据会丢失的，因此权衡利弊，引入了 redo log，也就是说，修改完后，不立即刷新，而是记录一条日志，日志内容就是记录哪个页面，多少偏移量，什么数据发生了什么变更。这样即使系统崩溃，再恢复后，也可以根据 redo 日志进行数据恢复。另外，redo log 是循环写入固定的文件，是顺序写入磁盘的。

3.隔离性实现原理（MVVC）

MVCC是什么？

是一种基于多版本的并发控制协议，只有在innodb引擎下存在。

它是mysql提高性能的一种方式，配合undo log日志和版本链，让不同事务的读-写，写-读操作可以并发执行，从而提高系统性能。

MVCC可以实现读操作不对数据加锁，即普通的select请求不会加锁，提高了数据库的并发处理能力。

借助MVCC中的版本链数据库可以实现READ COMMITTED读已提交、REPEATABLE TEAD可重复读的隔离级别。

MVCC如何实现？

InnoDB 的 MVCC 是通过在每行记录后面保存两个隐藏的列来实现的。一个保存了行的事务ID trx_id，一个保存了行的回滚指针roll_pt.

trx_id：每次对某记数据行改动时，都会把对应的事务 id 赋值给 trx_id 隐藏列。

roll_pt：每次对数据进行改动时，都会把旧的版本写入到 undo 日志中，然后这个隐藏列就相当于一个指针，可以通过它来找到该记录修改前的信息。连接的多了，就形成了版本链。

版本链：是roll_pt的产物，我们对某条数据更新后，都会将旧值放到一条undolog回滚日志中，就算是该记录的一个旧版本，随着更新次数的增多，所有版本都会被roll_pt属性连接成一个链表，我们把这个链表称之为版本链，版本链的头节点就是当前记录的最新值，另外，每个版本中还包含生成该版本时对应的事务id，这个信息很重要。

读已提交实现

读已提交和可重复读两个隔离级别实现依靠的是MVVC，即通过版本链实现

读已提交：只要别的事务提交了，那么另一个事务就可以看到

特点：每次读到的都是最新的数据。

当前读：每次读时，都会给版本链拍照，所以读到的数据是最新的（前提是已提交的数据）

可重复读的实现

可重复读：B事务开启后，第一次读到数据后，就定格下来，后面的读操作读到的就和这个数据一致，即使这个过程中别的事务可能已经对数据修改过了。所以叫做可重复读，因为你不论读多少次，都是第一次读的结果，可以重复读。

也可以叫快照读，因为第一次读的时候，会把版本链拍照，下次读时，从版本快照中读，所以第一次和第二次读到数据是一致的。

串行化实现依靠锁

4.事务一致性的实现则直接由其他三个特性来保证

本文总结：本篇讲了事务是什么？详细介绍了事务的四种特性，以及四种特性如何实现？还有特性之一的隔离性中的隔离级别都有什么？几种隔离级别依靠什么原理实现？如MVCC和版本链。

总之，事务是数据库很重要的一部分，我们对事务的学习是很必要的，对事物的介绍如有不全之处欢迎友友们在评论区补充哦~