【Redis】Redis主从同步中数据同步原理

1. 全量同步

主从第一次同步是全量同步。

数据同步包括以下三个阶段：

在从节点执行slaveof命令后，向主节点请求数据同步，主节点判断从节点是否是第一次同步，如果是第一次，则返回主节点的数据版本信息，从节点保存主节点的版本信息。
从节点第一次同步，主节点异步执行bgsave命令生成rdb文件，生成完成向从节点发送，从节点则清空本地数据去加载主节点的rdb文件实现一部分数据的同步。这时主节点和从节点之间的数据不一定是一致的。
如果在主节点执行bgsave的时候，主节点又执行了其他命令，这些命令会记录在 repl_baklog ，主节点发送其中的命令，从节点执行接收到的命令，这时就真正完成了主从数据的一致。

简述全量同步的流程：

master通过如下两个概念来判断slave是不是第一次来同步数据：

Replication Id：简称replid，是数据集的标记，id一致则说明是同一数据集。每一个master都有唯一的replid，slave则会继承master结点的replid。
offset：偏移量，•随着记录在repl_baklog中的数据增多而逐渐增大。slave完成同步时也会记录当前同步的offset。如果slave的offset小于master的offset，说明slave数据落后于master，需要更新。

所以，slave做数据同步必须向master声明自己的 replication id 和 offset ，master才可以判断到底需要同步哪些数据。

如果slave节点来请求master，必须带着自己的replid和offset，master节点则判断他们俩的replid是否相等，相等则说明不是第一次来，不相等说明是第一次来，做全量同步，并返回主节点的replid和offset，slave节点则继承这些信息。

主从第一次同步是全量同步，但如果slave重启后同步，则执行增量同步。

注：repl_baklog是一个环形的数组。

repl_baklog的大小有限，写满后会覆盖最早的数据。所以如果slave断开时间过久，导致尚未被封的数据被覆盖，则无法基于log做增量同步，只能再次全量同步。

简述全量同步和增量同步的区别？

什么时候执行全量同步？

什么时候执行增量同步？