redis集群扩容

背景介绍

在电商项目双11期间,通常有更多的并发,对redis的请求压力激增,需要更多的redis对外提供服务,但是过了双11,redis压力骤降,为了节省成本,需要撤出部分redis服务!我们可以通过增加和删除redis集群节点来实现redis集群的动态扩容、缩容,增加redis集群的高可用性。
原始集群(见下图)由6个节点组成,6个节点分布在三台机器上(本案例仅在一台机器演示!),采用三主三从的模式。
在这里插入图片描述
为了模拟集群扩容,我们在原始集群基础上再增加一主(8007)一从(8008),增加节点后的集群参见下图,新增节点用虚线框表示
在这里插入图片描述
在集群扩容之前,我们需要启动原redis集群,并观察集群状态是否正常,如果正常才可进行扩容、缩容。
启动成功后通过cluster nodes命令查看节点状态
在这里插入图片描述
从上图可以看出,整个集群运行正常,三个master节点和三个slave节点,8001端口的实例节点存储0-5460这些hash槽,8002端口的实例节点存储5461-10922这些hash槽,8003端口的实例节点存储10923-16383这些hash槽,这三个master节点存储的所有hash槽组成redis集群的存储槽位,slave点是每个主节点的备份从节点,不显示存储槽位!

2. redis集群扩容

原集群启动并确认健康后,我们在原始集群基础上再增加一主(8007)一从(8008),实现集群扩容,步骤如下:

2.1 增加redis实例

在/usr/local/redis-cluster下创建8007和8008文件夹,并拷贝8001文件夹下的redis.conf文件到8007和8008这两个文件夹下,具体步骤如下所示:

mkdir 8007 8008
cd 8001
cp redis.conf /usr/local/redis-cluster/8007/
cp redis.conf /usr/local/redis-cluster/8008/

# 修改8007文件夹下的redis.conf配置文件
vim /usr/local/redis-cluster/8007/redis.conf
# 修改如下内容:
port:8007
dir /usr/local/redis-cluster/8007/
cluster-config-file nodes-8007.conf
pidfile /var/run/redis_8007.pid


# 修改8008文件夹下的redis.conf配置文件
vim /usr/local/redis-cluster/8008/redis.conf
修改内容如下:
port:8008
dir /usr/local/redis-cluster/8008/
cluster-config-file nodes-8008.conf
pidfile /var/run/redis_8008.pid

# 启动8007和8008俩个服务并查看服务状态
/usr/local/redis-5.0.3/src/redis-server /usr/local/redis-cluster/8007/redis.conf
/usr/local/redis-5.0.3/src/redis-server /usr/local/redis-cluster/8008/redis.conf
ps -el | grep redis

启动完成后,8007 和 8008 两个节点还处于游离状态,还未加入redis集群中!

2.2 配置8007为master节点

使用redis-cli的add-node命令新增一个主节点8007(master),前面的ip:port为新增节点,后面的ip:port为集群中已存在的节点。

src/redis-cli --cluster add-node 192.168.100.100:8007 192.168.100.100:8001

这个过程是通过gossip协议的meet命令进行操作的!

meet:某个节点发送meet给新加入的节点,让新节点加入集群中,然后新节点就会开始与其他节点进行通信;

最后看到日志最后有"[OK] New node added correctly"提示代表新节点加入成功
在这里插入图片描述
添加成功后通过cluster nodes命令查看节点状态如下
在这里插入图片描述
注意:当添加节点成功以后,新增的节点不会有任何数据,因为它还没有分配任何的slot(hash槽),我们需要为新节点手工分配hash槽。使用redis-cli的rehash命令为8007分配hash槽,找到集群中的任意一个主节点,对其进行重新分片工作。

src/redis-cli --cluster reshard 192.168.100.100:8001

执行上述命令后,将进入手动分配槽位流程,分配详情如下:

... ...
How many slots do you want to move (from 1 to 16384)? 600
(ps:需要多少个槽移动到新的节点上,自己设置,比如600个hash槽)
What is the receiving node ID? 2728a594a0498e98e4b83a537e19f9a0a3790f38
(ps:把这600个hash槽移动到哪个节点上去,需要指定节点id)
Please enter all the source node IDs.(Please enter all the source node IDs)
  Type 'all' to use all the nodes as source nodes for the hash slots.
  Type 'done' once you entered all the source nodes IDs.(输入'all'以使用所有节点作为散列槽的源节点。输入所有源节点id后,键入'done')
Source node 1:all
(ps:输入all为从所有主节点(8001,8002,8003)中分别抽取相应的槽数指定到新节点中,抽取的总槽数为600个)
 ... ...
Do you want to proceed with the proposed reshard plan (yes/no)? yes
(ps:输入yes确认开始执行分片任务)
... ...

槽位分配完成后,再次通过cluster nodes命令查看节点状态如下:
在这里插入图片描述
注意:槽位迁移后,对应槽位中的数据也会迁移!
至此!8007master节点加入集群成功!

2.3 配置8008为8007的从节点

重复8008节点加入集群命令add-node

src/redis-cli --cluster add-node 192.168.100.100:8008 192.168.100.100:8001

通过cluster nodes命令查看节点状态
在这里插入图片描述
可以看到,8008同样是无槽位分配的,但由于8008节点要作为8007的从节点,所以不用给8008节点分配槽位。为8008节点配置主从关系需要连接8008节点的客户端,然后使用集群命令replicate进行操作,把当前的8008(slave)节点指定到一个主节点下(这里使用之前创建的8007主节点),命令如下:

# 进入8008的客户端
[root@CentOS7 redis-6.0.9]# src/redis-cli  -p 8008

# 在8008客户端下指定8008节点的主从关系
# 4b339ad25b4884c2ff6de8a8ec2bc8766f8faf0b 是8007节点的id
127.0.0.1:8008> cluster replicate 4b339ad25b4884c2ff6de8a8ec2bc8766f8faf0b

再通过cluster nodes命令查看节点状态
在这里插入图片描述
可以看到8008已成为8007的从节点,完成了集群节点的扩容!

3. redis集群缩容

redis集群缩容其实就是删除某些集群节点,在这里我们通过把上面加入的8007、和8008组成的集群节点删除来测试集群缩容!

3.1 先返还槽位数据

因为主节点8007的里面是有分配了hash槽的,所以我们这里必须先把8007里的hash槽放入到其他的可用主节点中去,然后再进行移除节点操作,不然会出现数据丢失问题(目前只能把master的数据迁移到一个节点上,暂时做不了平均分配功能),执行命令如下:

src/redis-cli  --cluster reshard 192.168.100.100:8007
 ... ...
How many slots do you want to move (from 1 to 16384)? 600
What is the receiving node ID? baf0c2f3afde2410e34351a8261a703f1394cee9
(ps:这里是需要把数据移动到哪?8001的主节点id)
Please enter all the source node IDs.
  Type 'all' to use all the nodes as source nodes for the hash slots.
  Type 'done' once you entered all the source nodes IDs.
Source node 1:4b339ad25b4884c2ff6de8a8ec2bc8766f8faf0b
(ps:这里是需要数据源,也就是我们的8007节点id)
Source node 2:done
(ps:这里直接输入done 开始生成迁移计划)
 ... ...
Do you want to proceed with the proposed reshard plan (yes/no)? Yes
(ps:这里输入yes开始迁移)

至此,我们已经成功的把8007主节点的数据迁移到8001上去了,我们可以看一下现在的集群状态如下图,你会发现8007下面已经没有任何hash槽了,证明迁移成功!
在这里插入图片描述

3.2 删除8007节点

最后我们直接使用del-node命令删除8007主节点即可

src/redis-cli  --cluster del-node 192.168.100.100:8007 4b339ad25b4884c2ff6de8a8ec2bc8766f8faf0b

最后cluster nodes命令查看节点状态,如果还原如初,则说明缩容成功!

4. Redis - 解决reshard 出现的bug :Syntax error ,try CLIENT (LIST|KILL|GETNAME|SETNAME|PAUSE|REPLY)

迁移有key-value的槽的时候,执行指令是redis-trib.rb reshard发现会出现报错:
报错内容为:Syntax error ,try CLIENT (LIST|KILL|GETNAME|SETNAME|PAUSE|REPLY)
但是迁移没有key-value的槽的时候就会执行成功。 这就说明问题出在了存不存在key-value上.

解决方案

只要将rb文件中迁移语句修改为:
source.r.call([“migrate”,target.info[:host],target.info[:port],“”,0,@timeout,“replace”,:keys,*keys])
source.r.call([“migrate”,target.info[:host],target.info[:port],“”,0,@timeout,:replace,:keys,*keys])
即不执行clientCommand,直接执行migrateCommand。

猜你喜欢

转载自blog.csdn.net/yzx3105/article/details/130484920