Redis 从入门到精通【进阶篇】之高可用哨兵机制(Redis Sentinel)详解


在这里插入图片描述

摘要:详细介绍Redis进阶中的高可用性方面,特别是哨兵机制(Redis Sentinel)。我们将探讨哨兵机制的组建过程、监控Redis库主库下线的判定方式、选举新主库的选出方法以及故障的转移过程。同时,还提供了一些参考文章供读者进一步了解。

本文参考蒋德钧 老师的《Redis 核心技术与实战-08 | 哨兵集群:哨兵挂了,主从库还能切换吗》

本章我们带着这些疑问来学习一下Redis高可用

  1. 什么是Redis的哨兵模式?
  2. 哨兵模式的优点是什么?
  3. 哨兵模式的工作原理是什么?
  4. 如何配置Redis的哨兵模式?
  5. 哨兵模式中的故障转移是如何实现的?

0.前言

我们先来了解一下哨兵机制实现了以下主要功能,进一步了解这些功能的实现原理。
在这里插入图片描述

  1. 监控:哨兵节点定期检查Redis主节点和从节点的健康状态。它们发送命令并等待响应,以确保Redis实例正常运行。如果一个节点没有响应,哨兵节点会将其标记为下线。

  2. 故障检测和转移:当一个哨兵节点检测到主节点下线时,它会将这个信息广播给其他哨兵节点。当大多数哨兵节点都确认主节点下线后,它们会开始选举出一个新的主节点。这个过程称为故障转移,它可以确保Redis集群在主节点故障时仍然能够正常运行。

  3. 自动故障转移:一旦新的主节点选出,哨兵节点会更新Redis从节点的配置,使它们切换到新的主节点。这个过程是自动进行的,无需人工干预。

  4. 配置提供和更新:哨兵节点会监控Redis集群的配置,并在需要时提供给客户端。当主节点发生故障转移时,哨兵节点会更新从节点的配置,使它们正确地连接到新的主节点。

  5. 提供集群信息:哨兵节点可以提供有关Redis集群的信息,如主节点、从节点和哨兵节点的地址和状态。

通过这些功能,哨兵机制可以提供高可用性和故障转移能力,确保Redis集群在主节点故障时仍然可用。

1. 原理详解

1.1. 哨兵机制的组建

哨兵实例之间可以相互发现,要归功于 Redis 提供的 pub/sub 机制,也就是发布 / 订阅机制。哨兵只要和主库建立起了连接,就可以在主库上发布消息了,比如说发布它自己的连接信息(IP 和端口)。同时,它也可以从主库上订阅消息,获得其他哨兵发布的连接信息。当多个哨兵实例都在主库上做了发布和订阅操作后,它们之间就能知道彼此的 IP 地址和端口。除了哨兵实例,我们自己编写的应用程序也可以通过 Redis 进行消息的发布和订阅。所以,为了区分不同应用的消息,Redis 会以频道的形式,对这些消息进行分门别类的管理。所谓的频道,实际上就是消息的类别。当消息类别相同时,它们就属于同一个频道。反之,就属于不同的频道。只有订阅了同一个频道的应用,才能通过发布的消息进行信息交换。

举个蒋德钧 老师在《Redis 核心技术与实战》中的例子
在主从集群中,主库上有一个名为__sentinel__:hello的频道,不同哨兵就是通过它来相互发现,实现互相通信的。我来举个例子,具体说明一下。在下图中,哨兵 1 把自己的 IP(172.16.19.3)和端口(26579)发布到__sentinel__:hello频道上,哨兵 2 和 3 订阅了该频道。那么此时,哨兵 2 和 3 就可以从这个频道直接获取哨兵 1 的 IP 地址和端口号。然后,哨兵 2、3 可以和哨兵 1 建立网络连接。通过这个方式,哨兵 2 和 3 也可以建立网络连接,这样一来,哨兵集群就形成了。它们相互间可以通过网络连接进行通信,比如说对主库有没有下线这件事儿进行判断和协商。
在这里插入图片描述
通过上面的讲解我们可以总结出来如下几点

  1. 哨兵集群的组建步骤
  • 步骤1:启动哨兵节点。
  • 步骤2:配置哨兵节点的监控对象。
  • 步骤3:哨兵节点之间的通信和协调。
  1. 哨兵节点的角色和作用
  • Master节点:负责处理读写请求的主节点。
  • Slave节点:通过复制Master节点的数据实现数据备份和读取。
  • Sentinel节点:监控Redis集群的状态,负责主库下线判定和故障转移。

1.1. 哨兵是如何知道从库的信息

哨兵向主库发送INFO命令,主库将从库列表发送给从库,哨兵跟从库列表中的从库建立连接,以便监控从库。
在这里插入图片描述

1.2. 主库下线的判定

在Redis Sentinel中,主从切换的执行由哨兵集群中的多个哨兵节点共同协作完成。当哨兵集群中的某个哨兵节点检测到主节点下线时,它会向其他哨兵节点发送消息,然后所有哨兵节点共同达成一致,选举出一个新的主节点,并将其他从节点指向新的主节点。选举的过程中,哨兵节点会通过投票和心跳机制来确定新的主节点。选举出的新主节点会广播给所有的客户端,以便它们能够与新的主节点进行通信。所以,主从切换的执行是由所有的哨兵节点共同参与的。
在这里插入图片描述

  1. 哨兵节点通过心跳机制监控主库的状态。
  2. 当哨兵节点判定主库下线时,会广播通知其他哨兵节点。
  3. 哨兵节点通过共识算法,确定主库是否真的下线。

1.3. 哨兵集群选举

  1. 当一个哨兵节点检测到主节点下线时,它会向其他哨兵节点发送消息,通知它们主节点已经下线。
  2. 其他哨兵节点接收到消息后,它们也会检查主节点是否下线。如果它们同意主节点已下线,它们会进入选举过程。
  3. 在选举过程中,哨兵节点会相互通信,通过投票和心跳机制来决定新的主节点。
  4. 每个哨兵节点会为自己选举一个优先级最高的候选节点,然后它们会将自己选举的候选节点发送给其他哨兵节点。
  5. 哨兵节点会根据候选节点的优先级来选出一个新的主节点。如果有多个候选节点具有相同的优先级,那么将根据配置文件中的故障转移超时属性来决定。
  6. 选举出的新主节点将会广播给所有的客户端,以便它们能够与新的主节点进行通信。
    需要注意的是,在选举过程中,哨兵节点需要达成多数派的共识才能选出新的主节点。例如,如果哨兵节点的总数为5,那么至少需要3个哨兵节点同意选举结果才能生效。
    这个选举过程确保了在主节点下线的情况下,哨兵集群能够自动选举出一个新的主节点,从而保证了Redis的高可用性。

总结一下

  1. 当主库下线后,哨兵节点会开始选举新的主库。
  2. 哨兵节点通过共识算法选出新的主库。
  3. 新主库被选出后,哨兵节点会通知其他节点进行切换。

大概过程如图
在这里插入图片描述

1.4. 故障的转移

  1. 当新主库选出后,哨兵节点会将从库切换到新主库。
  2. 客户端需要重新连接到新主库进行数据的读写操作。

2. 总结

通过本文的介绍,我们详细了解了Redis进阶中的高可用性方面,特别是哨兵机制(Redis Sentinel)。我们了解了哨兵机制的组建过程、监控Redis库主库下线的判定方式、选举新主库的选出方法以及故障的转移过程。对我们学习和面试都有一定的帮助。

参考文章:

  1. Redis Sentinel Documentation: https://redis.io/topics/sentinel
  2. 蒋德钧 老师的《Redis 核心技术与实战-08 | 哨兵集群:哨兵挂了,主从库还能切换吗》

3. Redis从入门到精通系列文章

《Redis 从入门到精通【进阶篇】之redis主从复制详解》
《Redis 从入门到精通【进阶篇】之Redis事务详解》
《Redis从入门到精通【进阶篇】之对象机制详解》
《Redis从入门到精通【进阶篇】之消息传递发布订阅模式详解》
《Redis从入门到精通【进阶篇】之持久化 AOF详解》
《Redis从入门到精通【进阶篇】之持久化RDB详解》
《Redis从入门到精通【高阶篇】之底层数据结构字典(Dictionary)详解》
《Redis从入门到精通【高阶篇】之底层数据结构快表QuickList详解》
《Redis从入门到精通【高阶篇】之底层数据结构简单动态字符串(SDS)详解》
《Redis从入门到精通【高阶篇】之底层数据结构压缩列表(ZipList)详解》
《Redis从入门到精通【进阶篇】之数据类型Stream详解和使用示例》

4. Redis哨兵模式面试题

根据上面的学习,我们来简答一下常见的Redis高可用相关面试题

4. 1. 什么是Redis的哨兵模式?

Redis的哨兵模式是一种用于实现高可用性的机制。在哨兵模式中,多个Redis实例组成一个哨兵集群,其中一个实例作为主服务器,其他实例作为从服务器。哨兵监控主服务器的状态,并在主服务器宕机时自动将某个从服务器提升为新的主服务器,以保证系统的持续可用性。

4. 2. 哨兵模式的优点是什么?

  • 自动故障转移:当主服务器宕机时,哨兵可以自动选举一个新的主服务器,从而保证系统的高可用性。
  • 实时监控:哨兵可以实时监控Redis实例的状态,并在发现异常时及时采取措施,如自动切换主服务器。
  • 灵活性:哨兵模式可以根据实际需求配置哨兵集群的大小,以适应不同规模的系统。

4. 3. 哨兵模式的工作原理是什么?

  • 哨兵集群中的哨兵不断地监控Redis实例的状态。
  • 每个哨兵通过发送PING命令来检测Redis实例的存活状态。
  • 如果一个哨兵发现主服务器宕机,它会通过选举算法选出一个新的主服务器,并将这一信息广播给其他哨兵。
  • 其他哨兵收到广播后,也会更新自己的配置,以适应新的主服务器。
  • 客户端可以通过连接任意一个哨兵来获取当前的主服务器地址,并与主服务器建立连接。

4. 4. 如何配置Redis的哨兵模式?

  • 在每个Redis实例的配置文件中设置sentinel参数,指定哨兵模式的相关配置。
  • 启动每个Redis实例,并指定相应的配置文件。
  • 在哨兵集群中的任意一个哨兵上运行redis-sentinel命令,启动哨兵进程。
  • 哨兵进程会自动发现其他哨兵和Redis实例,并开始监控它们的状态。

4. 5. 哨兵模式中的故障转移是如何实现的?

  • 当一个哨兵发现主服务器宕机时,它会向其他哨兵发送选举请求。
  • 哨兵集群中的所有哨兵会进行选举,选出一个新的主服务器。
  • 选举规则通常是根据优先级、最近一次复制偏移量等因素进行评估。
  • 选举完成后,新的主服务器地址会被广播给其他哨兵和客户端。
  • 客户端可以通过连接任意一个哨兵来获取新的主服务器地址,并与其建立连接。

在这里插入图片描述大家好,我是冰点,今天的高可用哨兵机制(Redis Sentinel)详解,全部内容就是这些。如果你有疑问或见解可以在评论区留言。

猜你喜欢

转载自blog.csdn.net/wangshuai6707/article/details/131708763