MySQL Binlog日志与主从复制一文详解

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第17天,点击查看活动详情

1. Binlog日志的介绍

Binlog是Binary log的缩写,即二进制日志。Binlog主要有三个作用:持久化时将随机IO转化为顺序IO,主从复制以及数据恢复。本文重点主从复制相关的问题。

Binlog日志由一个索引文件与很多日志文件组成,每个日志文件由魔数以及事件组成,每个日志文件都会以一个Rotate类型的事件结束。

image.png

对于每个事件,都可以分为事件头与事件体两部分:

事件头的结构如下所示:

image.png

事件体的结构包括固定大小与可变大小两部分。

对于Binlog日志的格式,做简单的了解即可,感兴趣的同学可以深入学习。

2. 主从复制

2.1 主从复制的流程

image.png

MySQL主从复制的流程大致如下:

  • 主库同步自己的Binlog日志给从库
  • 从库的IO线程将Binlog日志内容写入Relay Log
  • 从库的SQL线程取Relay Log并在数据库中进行回放

2.2 GTID

GTID是指全局事务标志,用来标记主从同步的情况。

master提交一个事务时会产生GTID,并且记录在Binlog日志中。从库的IO线程在读取Binlog日志时,会将其储存在自己的Relaylog中,并且将这个值设置到gtid_next中,即下一个要读取的GTID,从库读取这个gtid_next时,会对比自己的Binlog日志中是否有这个GTID:

  • 如果有这个记录,说明这个GTID的事务已经执行过了,可以忽略掉(幂等)。
  • 如果没有这个记录,slave就会执行该GTID事务,并记录到自己的Binlog日志中。

2.3 复制模型

  • 异步复制:master 把Binlog日志推送给slave,master不需要等到slave是否成功更新数据到Relay log,主库直接提交事务即可。这种模式牺牲了数据一致性。
  • 同步复制:每次用户操作时,必须要保证Master和Slave都执行成功才返回给用户。
  • 半同步复制:不要求Slave执行成功,而是成功接收Master日志就可以通知Master返回。

image.png

2.4 MGR模式

分布式一致性算法Paxos。由至少3个或更多个节点共同组成一个数据库集群,事务的提交必须经过半数以上节点同意方可提交提供,支持多写模式。

MGR 是 share-nothing 的复制方案,基于分布式paxos协议实现,每个实例都有独立的完整数据副本,集群自动检查节点信息,做数据的同步。同时提供单主模式和多主模式,单主模式在主库宕机后能够自动选主,所有写入都在主节点进行,多主模式支持多节点写入。同时集群提供冗余的容错功能,保证集群大多数节点正常集群就可以正常提供服务。

2.5 并行回放

事务回放是从库的SQL线程执行Relay Log的过程,并行回放是为了提高这一过程的效率,将可以并行进行的事务同时进行。

  • 基于逻辑时钟的并行回放

因为MySQL本身事务具有ACID的特点,所以从主库同步到从库的事务,只要其执行的逻辑时间上有重叠,那么这两个事务就能安全的进行并行回放。

  • 基于writeSet的并行回放

使用一个HashMap保存一定时间内针对某一块数据区域的事务的集合。如果事务在同一组内或者是逻辑时钟有重叠,说明没有冲突,其他情况不能确定是否有冲突。

猜你喜欢

转载自juejin.im/post/7107653530588020767