荔枝Redis高可用方案


一、背景

  • 线上redis架构,总共大概250套主从
  • 架构以1主1从为主,少部分1主多从
  • 大部分主库抗业务,从库做持久化及定时备份
  • 少部分主从(大概30多套)通过应用配置读写域名实现读写分离


二、业界成熟Redis高可用架构介绍

1. sentinel

10829844-26d1af745dea5376.png
sentinel架构

sentinel 检测原理

  • 每隔10s,每个sentinel会向主节点和从节点发送info replication命令获取最新的主从拓扑结构
  • 每隔2s,每个sentinel节点向redis节点的__ sentinel __:hello频道发送该sentinel节点对主节点判断及当前sentinel信息,其他sentinel节点也会订阅该频道,了解各个sentinel节点以及他们对主节点的判断
  • 每隔1s,每个sentinel节点会向所有redis节点以及其他sentinel节点发送ping命令做一次心跳检测,确认各个节点是否可达

sentinel 切换原理

主观下线:sentinel节点通过每2秒的ping心跳检测,超过down-after-milliseconds主观判断redis节点下线

客观下线:sentinel节点判断主观下线后,通过发送sentinel ismaster-down-by-addr到其他sentinel节点询问对主节点的判断,当超过quonum个数,则判断该redis主节点客观下线

故障转移过程

  1. sentinel节点判断redis节点主观下线
  2. sentinel节点判断redis节点客观下线
  3. sentinel节点发起选举,一旦节点获得max(quorum,num(sentinels)/2+1)的票数,即成为leader(选举过程非常快,基本上谁先完成客观下线,谁就是leader)
  4. 由sentinel leader节点进行redis failover

redis failover 包括提升redis从库为主库,将其他从库挂载到新主库等操作

特点

  • 一套sentinel集群至少3个节点,sentinel节点通过raft算法选举,节点个数为奇数
  • 1套sentinel集群可以监控多套redis主从
  • 建议部署方式:相同业务使用同一套sentinel集群进行监控。
  • Client 端需要修改连接方式,配置由原来直连域名,修改为配置sentinel集群信息+redis主节点标识名
  • sentinel只对主节点进行failover,从节点故障只做主观下线判断,没有后续的处理操作
  • sentinel不是中间件,应用只会在初次连接的时候请求sentinel返回一个redis主节点的连接池,实际上是直连redis主节点的。(持续订阅sentinel,当redis发生故障切换,会重新返回一个主节点连接池)

痛点

  • 客户端原生JedisSentinelPool只拿到redis主节点的连接池,无法支持读写分离
  • 应用端需要修改连接配置(这个其实不算很痛,可以逐步推进)


2. Redis-Cluster

10829844-009a271c69b52be6.png
redis-cluster

特点

  • 无中心分布式架构,解决高可用,扩展性问题
  • 集群中数据节点个数为奇数。每个节点代表一套redis主从(主库读写,从库备用)
  • 通过虚拟槽hash到各节点(总共16384个slots),实现数据分片
  • 无代理层,client端配置集群所有节点信息。连接集群中任一节点皆可访问整个集群数据(自动路由)
  • 据说存在不少坑,需要先部署测试一段时间再上线


三、适合荔枝的Redis高可用架构

从荔枝整体redis环境看,redis多为单主从,实例数据大部分在10G以内,不同业务之间实例相互独立。sentinel是最合适的高可用方式。主要解决读写分离和域名切换的问题,这里给出2种方案

1. sentinel+consul

sentinel 负责故障主从切换,consul 主要提供DNS,健康检测,服务发现,域名切换
consul简介

10829844-50994e21f193b5cc.png
consul introduce

整体架构
10829844-e62cc7f568020955.png
consul+sentinel redis高可用

说明

  • 客户端需要改成特定后缀的域名格式(比如.consul)
  • 每台缓存机器部署一个consul client,用于该机器所有redis实例的服务发现,健康检测
  • consul可以实现从节点的故障转移

2. sentinel(取消读写分离) + redis-cluster(个别大数据量高并发实例)

整体架构

10829844-06c497105f0a4ebb.png
sentinel整体架构.png

说明

  • 这套架构可以满足目前90%的redis高可用需求,架构复杂度低,建议优先考虑
  • python redis库支持读写分离,可以通过master标识名拿到从库连接。jedis待测试
    >>> from redis.sentinel import Sentinel
    >>> sentinel = Sentinel([('localhost', 26379)], socket_timeout=0.1)
    >>> master = sentinel.master_for('mymaster', socket_timeout=0.1)
    >>> master.set('foo', 'bar')
    >>> slave = sentinel.slave_for('mymaster', socket_timeout=0.1)
    >>> slave.get('foo')
  • 对于现有的小部分做了读写分离的实例,先评估是否可以取消掉读写分离,接入sentinel
  • 对于大数据量,高并发的实例,考虑接入Redis-Cluster

猜你喜欢

转载自blog.csdn.net/weixin_34357928/article/details/87008079