Redisの高可用性技術ソリューションの概要分析
本論文では、主に自分の長所と短所を分析するためのRedis、いくつかの一般的な使用を扱っています。
まず、一般的な使用
Redisのは、いくつかの一般的な用途は次のとおりです。
Redisの単一コピー。
Redisの複数のコピー(マスタスレーブ)。
Redisのセンチネル(センチネル)。
Redisのクラスタ。
Redisの自己研究。
長所と短所の第二に、使用
1、Redisの単一のコピー
Redisの単一コピー、単一ノード配備アーキテクチャを使用してのRedisは、データのバックアップノードのないリアルタイムの同期はありませんが、それほど厳しいキャッシュ純粋なビジネスシナリオのデータの信頼性のためにデータの永続性とバックアップ戦略を提供していません。
利点:
シンプルな構造、展開が容易。
費用対効果:なしスペアノードキャッシュ使用は(単一インスタンスまたはスーパーバイザは、crontabの可用性の保証を使用することができます)、もちろん、ビジネスの高可用性を満たすために、あなたはまた、スペアノードを犠牲にすることができますが、同時に外部サービスのインスタンスは1つだけです。
高性能。
短所:
これは、データの信頼性を保証するものではありません。
ビジネスの高いデータ信頼性要件に適していないため、データが失われた後、予備ノードアドレスの高可用性がある場合でも、プロセスを再起動して、それでもキャッシュ温暖化の問題を解決することはできません、と、キャッシュを使用してください。
高いパフォーマンスは、シングルコアCPU(Redisのは、シングルスレッド機構である)、メインCPUボトルネック、簡単な操作コマンドのように、発注、少ない計算シーンの処理能力によって制限されます。また、Memcachedの代替使用を考慮することができます。
2、Redisの複数のコピー(マスタスレーブ)
Redisの複数のコピーは、最大の特徴の観点からの単一のコピーに比べて(複製)構造、からマスターの展開を使用すると、リアルタイムのデータから、インスタンス間のマスタの同期であり、データの永続性とバックアップ戦略を提供します。別の物理サーバー上に展開マスタースレーブ・インスタンス、会社の基盤環境の構成に応じて、同時にサービスや個別の読み取りおよび書き込みポリシーを提供達成することができます。
利点:
高い信頼性:プライマリ・データベースは、サービスの円滑な動作を保証するサービスを提供するライブラリからの一次ライブラリーに、自動スイッチオーバーを失敗したときに一つの局面において、デュアルスタンバイアーキテクチャの使用を行うことができ、一方、データの永続性機能がオンになっていますかつ合理的なバックアップ戦略を設定し、効果的に異常なデータ誤用やデータ損失の問題を解決することができます。
別々の読み取りと戦略を書く:ノードから読み取る能力を効果的に読み込み、同時大量に対処するために、マスター・データベースのノードを展開することができます。
短所:
故障恢复复杂,如果没有RedisHA系统(需要开发),当主库节点出现故障时,需要手动将一个从节点晋升为主节点,同时需要通知业务方变更配置,并且需要让其它从库节点去复制新主库节点,整个过程需要人为干预,比较繁琐;
主库的写能力受到单机的限制,可以考虑分片;
主库的存储能力受到单机的限制,可以考虑Pika;
原生复制的弊端在早期的版本中也会比较突出,如:Redis复制中断后,Slave会发起psync,此时如果同步不成功,则会进行全量同步,主库执行全量备份的同时可能会造成毫秒或秒级的卡顿;又由于COW机制,导致极端情况下的主库内存溢出,程序异常退出或宕机;主库节点生成备份文件导致服务器磁盘IO和CPU(压缩)资源消耗;发送数GB大小的备份文件导致服务器出口带宽暴增,阻塞请求,建议升级到最新版本。
3、Redis Sentinel(哨兵)
Redis Sentinel是社区版本推出的原生高可用解决方案,其部署架构主要包括两部分:Redis Sentinel集群和Redis数据集群。
其中Redis Sentinel集群是由若干Sentinel节点组成的分布式集群,可以实现故障发现、故障自动转移、配置中心和客户端通知。Redis Sentinel的节点数量要满足2n+1(n>=1)的奇数个。
优点:
Redis Sentinel集群部署简单;
能够解决Redis主从模式下的高可用切换问题;
很方便实现Redis数据节点的线形扩展,轻松突破Redis自身单线程瓶颈,可极大满足Redis大容量或高性能的业务需求;
可以实现一套Sentinel监控一组Redis数据节点或多组数据节点。
缺点:
部署相对Redis主从模式要复杂一些,原理理解更繁琐;
资源浪费,Redis数据节点中slave节点作为备份节点不提供服务;
Redis Sentinel主要是针对Redis数据节点中的主节点的高可用切换,对Redis的数据节点做失败判定分为主观下线和客观下线两种,对于Redis的从节点有对节点做主观下线操作,并不执行故障转移。
不能解决读写分离问题,实现起来相对复杂。
建议:
如果监控同一业务,可以选择一套Sentinel集群监控多组Redis数据节点的方案,反之选择一套Sentinel监控一组Redis数据节点的方案。
sentinel monitor 配置中的建议设置成Sentinel节点的一半加1,当Sentinel部署在多个IDC的时候,单个IDC部署的Sentinel数量不建议超过(Sentinel数量 – quorum)。
合理设置参数,防止误切,控制切换灵敏度控制:
a. quorum
b. down-after-milliseconds 30000
c. failover-timeout 180000
d. maxclient
e. timeout
部署的各个节点服务器时间尽量要同步,否则日志的时序性会混乱。
Redis建议使用pipeline和multi-keys操作,减少RTT次数,提高请求效率。
自行搞定配置中心(zookeeper),方便客户端对实例的链接访问。
4、Redis Cluster
Redis Cluster是社区版推出的Redis分布式集群解决方案,主要解决Redis分布式方面的需求,比如,当遇到单机内存,并发和流量等瓶颈的时候,Redis Cluster能起到很好的负载均衡的目的。
Redis Cluster集群节点最小配置6个节点以上(3主3从),其中主节点提供读写操作,从节点作为备用节点,不提供请求,只作为故障转移使用。
Redis Cluster采用虚拟槽分区,所有的键根据哈希函数映射到0~16383个整数槽内,每个节点负责维护一部分槽以及槽所印映射的键值数据。
优点:
无中心架构;
数据按照slot存储分布在多个节点,节点间数据共享,可动态调整数据分布;
可扩展性:可线性扩展到1000多个节点,节点可动态添加或删除;
高可用性:部分节点不可用时,集群仍可用。通过增加Slave做standby数据副本,能够实现故障自动failover,节点之间通过gossip协议交换状态信息,用投票机制完成Slave到Master的角色提升;
降低运维成本,提高系统的扩展性和可用性。
缺点:
Client实现复杂,驱动要求实现Smart Client,缓存slots mapping信息并及时更新,提高了开发难度,客户端的不成熟影响业务的稳定性。目前仅JedisCluster相对成熟,异常处理部分还不完善,比如常见的“max redirect exception”。
节点会因为某些原因发生阻塞(阻塞时间大于clutser-node-timeout),被判断下线,这种failover是没有必要的。
数据通过异步复制,不保证数据的强一致性。
多个业务使用同一套集群时,无法根据统计区分冷热数据,资源隔离性较差,容易出现相互影响的情况。
Slave在集群中充当“冷备”,不能缓解读压力,当然可以通过SDK的合理设计来提高Slave资源的利用率。
Key批量操作限制,如使用mset、mget目前只支持具有相同slot值的Key执行批量操作。对于映射为不同slot值的Key由于Keys不支持跨slot查询,所以执行mset、mget、sunion等操作支持不友好。
Key事务操作支持有限,只支持多key在同一节点上的事务操作,当多个Key分布于不同的节点上时无法使用事务功能。
Key作为数据分区的最小粒度,不能将一个很大的键值对象如hash、list等映射到不同的节点。
不支持多数据库空间,单机下的redis可以支持到16个数据库,集群模式下只能使用1个数据库空间,即db 0。
复制结构只支持一层,从节点只能复制主节点,不支持嵌套树状复制结构。
避免产生hot-key,导致主库节点成为系统的短板。
避免产生big-key,导致网卡撑爆、慢查询等。
重试时间应该大于cluster-node-time时间。
Redisのクラスタは、最大リダイレクト生成されたシーンを減らし、マルチキーやパイプライン動作を推奨しません。
5、Redisの自己開発
高可用性ソリューションのRedisの自己開発は、主に中央の設定、障害検出およびフェイルオーバー・ハンドリング機構では、通常、オンライン彼らのビジネスの実際の環境に応じてカスタマイズする必要があります。
利点:
高い信頼性と高可用性。
高い自己制御;
ビジネスの実際のニーズに適切な、抵抗、良好な相溶性を縮小することがあります。
短所:
複雑な、高い開発コストを実装します。
などのようなメタデータ情報を格納するための監視、ドメインネームサービスデータベースなど近隣施設の支援の必要性。
高いメンテナンスコスト。