【07】MySQL：主从复制

写在前面的话

对于企业而言，在互联网这一块其实最重要的是数据。保证数据的安全性，稳定性是作为运维人的基本工作职责。于是为了数据安全性，引进了数据备份，bin log 等。但这并不意味着有这些就足够了。试想一下，假设我们的数据库服务器宕机了，原因可能是机器炸了，硬件故障，而数据量又特别大。如果新建数据库再恢复可能需要半天乃至于一天的时间。那么在这段时间，所有服务的都是无法使用的。这样一天下来，很难想象对于公司造成的损失到底有多大，特别是上市公司，股票可能暴跌。那么有没有一种方法，能够帮助我们在遇到这种事故的时候实现快速切换？保证服务不中断？有的。这节就主要来说说最简单最基础的方式，主从复制。

关于主从复制

对于主从复制，需要知道一些它的基本原理：

1. 主从复制的服务器包含两个角色：Master 和 Slave。

2. 主从复制是基于二进制日志（bin log）的，这意味主节点（Master）必须开启二进制日志。

3. 从库（Slave）通过特定的线程获取到主库（Master）的二进制日志，并在从库中执行，从而实现和主库数据保持一致。

由此可以得出，出从更多的解决是主库一键故障，系统故障，而不是例如删库这样的操作，因为删库操作会在从库也执行。

主从复制的前提：

1. 两台 MySQL，配置不同的 server_id。

2. 主库开启了 bin log。

3. 拥有用于主从复制的专有用户。

4. 从库数据是主库数据的某个时间点的。

搭建最基础的主从复制

1. 主库中开启 bin log，配置不同 server_id：

主库 /etc/my.cnf：

server_id=111
log_bin=/data/logs/mysql/binlog/mysql-bin
binlog_format=row

从库 /etc/my.cnf：

server_id=112
log_bin=/data/logs/mysql/binlog/mysql-bin
binlog_format=row

2. 主库新建同步用户，并备份主库：

创建同步授权用户：

grant replication slave on *.* to 'repl'@'192.168.100.112' identified by '123';

同步用户只需要授权：replication slave 权限即可

备份主库：

mysqldump -uroot -p -S /data/logs/mysql/mysql.sock -E -R -A --triggers --master-data=2 --single-transaction --set-gtid-purged=OFF >/tmp/data.sql

查看备份中的指针（Position），并记录：

head -30 /tmp/data.sql

结果：

关键：MASTER_LOG_FILE='mysql-bin.000002'，MASTER_LOG_POS=971592

3. 从库中导入备份：

source /tmp/data.sql

4. 从库中配置主库连接信息：

help change master to;

查看用法：

根据这个帮助文档中示例就行修改，然后执行：

CHANGE MASTER TO
  MASTER_HOST='192.168.100.111',
  MASTER_USER='repl',
  MASTER_PASSWORD='123',
  MASTER_PORT=3306,
  MASTER_LOG_FILE='mysql-bin.000002',
  MASTER_LOG_POS=971592;

5. 从库中启动 slave：

start slave;
show slave status\G

查看结果：

主要看这两个 Yes，表示开启主从复制成功。

6. 主库测试：在主库新家数据库在从库查看结果：

create database testdb3;

从库查看：

至此，最基本的主从复制完成！

主从复制分析

在主从复制搭建完成后，可以对其进行分析：

线程方面：

主库：dump 线程

从库：IO 线程，SQL 线程

文件方面：

主库：mysql-bin.00000x（二进制日志文件）

从库：

demo-node2-relay-bin.000001（中继日志）

master.info（主库信息）

relay-log.info（中继日志应用情况）

主从复制原理：

整个主从复制过程：

1. 从库执行 CHANGE MASTER TO 以后，关于主库的 IP，端口，同步账户等信息就被保存到了 master.info 文件中。

2. 从库执行 START SLAVE; 之后，从库开启两个线程：IO 和 SQL。

3. IO 线程读取 master.info 的信息连接主库，主库创建 DUMP 线程来响应从库。

4. IO 线程根据 master.info 中的指针（Position）和 bin log 文件向 DUMP 请求最新的日志。

5. DUMP 线程根据收到的 IO 线程的指针信息查看 bin log，如果有更新，则传递给从库 IO 线程。

6. IO 线程将收到的日志保存在 TCP/IP 缓存中，并向主库 DUMP 线程应答，至此主库的工作完成。

7. IO 线程将缓存中的数据存储到 relay-log 日志文件中，并更新 master.info 中的指针。至此，IO 线程工作完成。

8. SQL 线程读取 relay-log.info，获取到上次的起点，然后将日志中新增的在从库执行，完成后更新 relay-log.info。

至此，整个同步过程完成，需要知道的是，每次主库产生新数据都会发信号给 DUMP 线程，IO 线程再度发起请求。

查看主库：

查看从库：

Slave 状态说明：

show slave status\G

1. 主库相关的信息：

Master_Host: 192.168.100.111
Master_User: repl
Master_Port: 3306
Master_Log_File: mysql-bin.000002
Read_Master_Log_Pos: 971760

2. 中继日志信息：

Relay_Log_File: demo-node2-relay-bin.000002
Relay_Log_Pos: 488

3. 从库线程：

Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Last_IO_Errno: 0
Last_IO_Error:
Last_SQL_Errno: 0
Last_SQL_Error:

4. 过滤复制相关：

Replicate_Do_DB:
Replicate_Ignore_DB:
Replicate_Do_Table:
Replicate_Ignore_Table:
Replicate_Wild_Do_Table:
Replicate_Wild_Ignore_Table:

5. 从库延时：（因系统原因导致）

Seconds_Behind_Master: 0

6. 人为设置的主从延时：

SQL_Delay: 0
SQL_Remaining_Delay: NULL

7. GTID 复制相关：

Retrieved_Gtid_Set: 
Executed_Gtid_Set: 
Auto_Position: 0

一般故障总结

在主从配置的时候，一般如果从库无法连接上主库的原因大致有以下几个：

1. 用户名，密码，端口，地址错误导致无法连接。

2. 主库达到连接数量上限，主库繁忙导致无法连接。

3. 防火墙，Selinux，网络问题导致无法连接。

这类问题有一个统一的排查方法，就是使用同步用户在从库上面直接远程测试连接主库看能否连接上。

主从同步失败故障原因：

1. 主库未开启二进制或者从库配置的二进制指针错误导致同步失败。

2. relay-log 缺失或者损坏，导致 SQL 线程无法执行。

3. 主从数据库版本差异，导致某些语法在另外一个库上面不同，从而无法执行。

4. 直接修改了从库，导致和主库已经不一致，再去同步操作某些可能不存在的数据出错。

这类问题的终极处理办法都是推荐重新创建主从环境，并确保两边的配置。

为了避免误操作从库导致主从同步失败，可以将从库配置为只读，当时是针对普通用户：

show variables like '%read_only%';

结果：

当然对于同步中出现同步某个同步失败的情况，可以跳过该事务：（生产环境坚决不允许，不然可能出现大坑）

方法1：

stop slave; 
-- 将同步指针向下移动一个，如果多次不同步，可以重复操作。
set global sql_slave_skip_counter = 1;
start slave;

方法2：配置文件中添加（虽然可以解决，但是坚决不允许）

slave-skip-errors = 1032,1062,1007

错误代码说明：

1007：对象已存在

1032：无法执行DML

1062：主键冲突，或约束冲突

主从同步延时故障分析

在同步过程中，可能会出现主库执行的 SQL 在从库结果一段时间后才会执行的情况，针对于该类问题，可以将原因归咎于以下几个方面：

1. 外在因素：

外在因素有很多，可能是网络传输性能差，服务器性能差，参数版本问题等。

2. 主库因素：

二进制写入不及时，二进制日志写入策略为延时写入（sync_binlog），因为从库是根据二进制日志同步的。

在 5.6 之前版本，DUMP 线程是串行传输二进制日志。主库事务大，可以并行执行，但是从库只能串行（类似多线程和单线程）。

解决办法为开启 GTID 功能，实现 GC（group commit），并行传输日志给从库。对于大事务建议拆分成小事务。

3. 从库因素：

在传统的主从同步中，只有一个 SQL 线程，所以日志到从库还是串行执行，所以慢。

解决办法：5.6 版本开启 GTID 后，从库就能实现 SQL 线程的多线程执行，但只能针对不同库并发。

5.7 以后的版本开启 GTID 以后针对逻辑时钟实现 SQL 多线程，这才是正在多线程（MTS）。另外就是事务不应该太大。

总而言之，版本 5.7 以上，开启 GTID 能够解决很多问题。

人为实现主从延时

在某些特殊时候，并不一定需要主库执行之后从库立即执行。之前说过，主从能够解决因为系统或者硬件故障引起的主库挂掉的问题。但是无法解决类似 drop database 这类问题。因为从库也会跟着 drop，所以这个时候就有了主从延时发挥作用了。

假设这样一个场景，配置了主从延时 3 小时，如果主库执行了 drop database，那么在这 3 个小时内我们有 99% 的可能性发现问题。所以此时我们只需要去从库 stop slave，从库就不会执行 drop database 操作，而我们恢复的数据也就变成最近 3 个小时以内的即可。大大减少了我们恢复的时间。

具体配置方式：

从库执行：

stop slave;
CHANGE MASTER TO MASTER_DELAY=300;
start slave;

在主库上面删除测试库可以在从库查看：

show slave status\G

结果：

上面是配置的延时时间，下面是距离执行还需要的时间，我们配置的 300 秒。

延时从库故障恢复模拟

准备工作：

特别提示：生产环境出现问题，先备份，再操作。

一个主从环境，为了便于观察，配置主从延时为 3000 秒。

在主库上面执行一系列的操作，并删库，期间还有其它写入：

create database testdb3 charset utf8;
use testdb3;
create table t1(id int(4),name char(10));
insert into t1 values(1, "张三");
insert into t1 values(2, "李四");
commit;
insert into t1 values(3, "王五");
commit;
drop database testdb3;
create database testdb4;
use testdb4;
create table t1(id int(4),name char(10));
insert into t1 values(1, "AAA");
insert into t1 values(2, "BBB");
commit;

从库查看：

show slave status\G

还没有执行：

此时我们主库已经删库了，并且 DUMP 线程已经将这些步骤都传输给了从库，从库只是等待时间执行而已。

同时我们需要记录当前的 relay-log 执行到的指针：

1. 关闭主库，避免再度有新数据写入，然后停止同步，这样从库的 SQL 线程就不会再去执行 relay-log：

stop slave;

2. 处理 relay-log：因为 relay-log 说到底还是 binlog 的一种，所以个之前的恢复方式一样：

mysqlbinlog --no-defaults --base64-output=decode-rows -vvv "demo-node2-relay-bin.000002" >/tmp/relay.sql

先将所有的 relay-log 导出为我们看的懂的 SQL 文件，这样便于我们寻找 drop 命令。

通过 vim 打开，可以找到对于的指针：

所以，本次截取的 relay-log 中的 SQL 我们期望的是 320 - 最后，但是要剔除 1558：

mysqlbinlog --no-defaults --start-position=320 "/data/data/mysql/demo-node2-relay-bin.000002" >/tmp/relay-1.sql

再次 vim 新的 SQL 文件，然后删除掉 drop 命令所在的 GTID 整个事务：

3. 在从库执行这个 SQL：

为了避免 GTID 问题，可以先执行重置，因为最终我们会将该库数据作为准确数据。

reset master;

然后导入 SQL：

source /tmp/relay-1.sql

完成后查看：

此时数据已经有了，并且还需要清理从库身份：

reset slave all;

现在去查看 relay-log 中的内容就已经没有了，被清除干净：

show relaylog events in 'demo-node2-relay-bin.000002';

结果：

这样最终实现了在从库恢复了所有数据，这个时候再把从库当作主库重新搭建主从也好，还是将数据导出再导入主库重新搭建主从也好。都不至于删库跑路了。

半同步复制（了解即可）

在之前介绍主从同步原理的时候，DUMP 线程将二进制日志发送给 IO 线程，IO 线程将日志存在缓存中然后恢复给主库一个 ACK 信号。那么主库的工作就完成了。

然而这个过程中有一个问题，就是主库其实是根本不知道从库有没有执行成功的。或许从库正准备执行，然后就宕机了呢？

于是，为了提高主从数据的一致性，便有了半同步复制。

工作原理：

1. 主库提交事务，发送信号给 DUMP 线程，DUMP 线程发信号给从库 IO 线程。

2. IO 线程向主库请求新的二进制日志。

3. DUMP 线程发送二进制日志给 IO 线程，IO 线程接受后，当日志被写到 relay-log 后，返回给主库 ACK_reciver 线程一个信号。

4. ACK_reciver 线程收到信号后告知主库同步成功。

5. 如果 ACK 线程超多预设的时间还没有收到信号，则切换回原始的异步复制。

这里配置就不再做阐述，该同步存在一定的问题，现在很少使用。

过滤复制

在某些特殊情况下，可能存在一些特殊的需求，比如只需要同步某一单独的库，而其它不需要同步，这时候便需要用到过滤。

看一个简单的示例架构，一个项目，有三个数据库，但是该项目主要还是查询居多，于是做了读写分类，从库读，主库写：

在查看从库状态的时候，有几个参数：

Replicate_Do_DB:
Replicate_Ignore_DB:
Replicate_Do_Table:
Replicate_Ignore_Table:
Replicate_Wild_Do_Table:
Replicate_Wild_Ignore_Table:

这就是同步过滤的关键，而在这 6 个参数中，用的最多的是：

Replicate_Do_DB：数据库过滤白名单

Replicate_Ignore_DB：数据库过滤黑名单

实现库的过滤方式有两种：

1. 主库配置：

Binlog_Do_DB: 
Binlog_Ignore_DB:

也就是指定哪些库能够记录 binlog，因为同步就是基于 binlog 的。但是这种方法及其不推荐，这样数据丢了无法没有 binlog 的就无法恢复。

2. 从库配置：

Replicate_Do_DB:
Replicate_Ignore_DB:

配置需要同步的库，获取配置不同步的库。

过滤复制示例

准备工作：搭建完成的基本主从复制环境

1. 修改从库配置文件，添加需要同步的数据库：

replicate_do_db=testdb1
replicate_do_db=testdb2

有多少个就添加多少个，不能用逗号隔开。完成后重启数据库查看：

show slave status\G

结果：

2. 修改主库测试同步效果：

use testdb1;
drop table t3;
use testdb2;
drop table t1;
use testdb4;
drop table t1;

查看从库：

此时同步的库已经同步了，没同步的不变。

GTID 复制

准备工作：准备两台虚拟机，都安装了数据库。一台已经有数据，另外一台初始化完成的状态。

可以删掉其他库，然后执行：

stop slave;
reset slave all;
reset master;

1. 修改主库和从库的配置文件，增加 GTID 配置：

# 开启 GTID
gtid-mode=on
# 强制 GTID 一致性
enforce-gtid-consistency=true
# Slave 更新写入日志
log-slave-updates=1

2. 备份主库导入从库：

mysqldump -uroot -p -S /data/logs/mysql/mysql.sock -E -R -A --triggers --master-data=2 --single-transaction >/tmp/data.sql

值得注意的是，千万不能有 --set-gtid-pureged=OFF 参数，因为我们需要 GTID。

从库导入：

source /tmp/data.sql

3. 由于同步用户已经存在，所以直接配置同步，启动同步：

CHANGE MASTER TO
MASTER_HOST='192.168.100.111',
MASTER_USER='repl',
MASTER_PASSWORD='123',
MASTER_PORT=3306,
MASTER_AUTO_POSITION=1;

相比于传统的主从同步需要指定指针，GTID 由于在备份中已经存在，所以直接 AUTO。

start slave;

查看结果：

如果同步失败，会在下面配置的地方显示错误的 GTID 编号：

注意：解决主从同步失败最好的办法就是重新构建主从环境，而不是想办法绕开错误的点。

GTID 复制的优点：

1. 无论你多少从，它们的 GTID 都是一致的，这样有助于以后跨主机恢复。

2. 备份导入后不需要再度指定指针，直接 auto 即可。

3. 复制过程中，从库不在需要 master.info 文件，直接读取 relay-log 的 GTID。

4. 备份中会包含 GTID 的值，所以请求 binlog 就直接根据该值查询下一个事务，不会重复执行了。

小结

主从复制在实际生产中应用非常广，如果你的数据库连最简单的主从都没有，无异于在走钢丝。最终我们推荐主从的基础模式都想 GTID 复制靠拢，能够大大的提升性能。

【07】MySQL：主从复制

猜你喜欢