序文

前の 2 つの記事では、Redis のメモリモデルと Redis の永続性についてそれぞれ紹介しました。

Redis の永続性で述べたように、Redis の高可用性ソリューションには、永続性、マスター/スレーブレプリケーション (および読み取り/書き込み分離)、センチネル、クラスターが含まれます。その中で、永続性は Redis データのスタンドアロンバックアップ (メモリからハードディスクへのバックアップ) に焦点を当てており、マスター/スレーブレプリケーションはデータのマルチマシンのホットバックアップに焦点を当てています。さらに、マスター/スレーブレプリケーションにより、負荷分散と障害回復も実現できます。

この記事では、マスタースレーブレプリケーションの使用方法、マスタースレーブレプリケーションの原理 (完全レプリケーションと部分レプリケーション、ハートビートメカニズムに焦点を当てます)、マスタースレーブレプリケーションのあらゆる側面を詳しく紹介します。実際のアプリケーションで注意が必要な問題 (データの不整合、レプリケーションタイムアウト、レプリケーションバッファオーバーフローなど)、マスター/スレーブレプリケーションに関連する構成 (repl タイムアウト、クライアント出力バッファ制限スレーブに焦点を当てる) など。

1. マスタ・スレーブ型レプリケーションの概要

マスター/スレーブレプリケーションとは、1 つの Redis サーバーのデータを他の Redis サーバーにコピーすることを指します。前者をマスターノード(master)、後者をスレーブノード(slave)と呼び、データの複製はマスターノードからスレーブノードへのみの一方向です。

デフォルトでは、各 Redis サーバーはマスターノードであり、マスターノードは複数のスレーブノードを持つことができます (またはスレーブノードを持たない) が、スレーブノードが持つことができるマスターノードは 1 つだけです。

マスター/スレーブレプリケーションの役割

マスター/スレーブレプリケーションの機能は主に次のとおりです。

データ冗長性: マスター/スレーブレプリケーションは、永続化以外のデータ冗長化方法であるデータのホットバックアップを実装します。
障害回復: マスターノードに問題が発生した場合、スレーブノードは迅速な障害回復を実現するためのサービスを提供できます。これは実際には一種のサービス冗長性です。
負荷分散: 読み取り/書き込み分離と組み合わせたマスター/スレーブレプリケーションに基づいて、マスターノードは書き込みサービスを提供し、スレーブノードは読み取りサービスを提供できます (つまり、アプリケーションは Redis データの書き込み時にマスターノードに接続します) 、アプリケーションは Redis データの読み取り時にスレーブノードに接続します)、サーバーの負荷を共有するため、特に書き込みを減らし読み取りを増やすシナリオでは、複数のスレーブノードで読み取り負荷を共有すると、Redis サーバーの同時実行性が大幅に向上します。
高可用性の基礎: 上記の機能に加えて、マスター/スレーブレプリケーションもセンチネルとクラスターの実装の基礎となるため、マスター/スレーブレプリケーションは Redis の高可用性の基礎となります。

2. マスタースレーブレプリケーションの使用方法

マスター/スレーブレプリケーションをより直観的に理解するために、その内部原理を紹介する前に、まずマスター/スレーブレプリケーションを有効にするためにどのように操作する必要があるかを説明します。

1. コピーを作成する

マスター/スレーブレプリケーションのアクティブ化はスレーブノードで完全に開始されるため、マスターノードでは何もする必要がないことに注意してください。

スレーブノードでマスター/スレーブレプリケーションを有効にするには、次の 3 つの方法があります。

(1) 設定ファイル

スレーブサーバーの設定ファイルにslaveof <masterip> <masterport>を追加します。

(2) 起動コマンド

redis-server 起動コマンドの後に --slaveof <masterip> <masterport> を追加します

(3) クライアントコマンド

Redis サーバーが起動した後、クライアント経由でコマンド「slaveof <masterip> <masterport>」を直接実行すると、Redis インスタンスがスレーブノードになります。

上記 3 つのメソッドは同等ですが、クライアントコマンドメソッドを例として、slaveof 実行後の Redis マスターノードとスレーブノードの変化を見てみましょう。

2. 例

準備: 2 つのノードを起動します

便宜上、実験で使用されるマスターノードとスレーブノードは 1 台のマシン上の異なる Redis インスタンスであり、マスターノードはポート 6379 をリッスンし、スレーブノードはポート 6380 をリッスンします。スレーブノードがリッスンするポート番号は変更できます。構成ファイル内:

起動後、以下が表示されます。

2 つの Redis ノード (それぞれ 6379 ノードおよび 6380 ノードと呼ばれます) が起動されると、デフォルトでは両方ともマスターノードになります。

コピーを作成する

この時点で、6380 ノードでslaveof コマンドを実行して、6380 ノードをスレーブノードにします。

効果を観察する

マスター/スレーブレプリケーションが確立された後、マスターノードのデータがスレーブノードにコピーされることを確認してみましょう。

(1) まず、スレーブノードから存在しないキーをクエリします。

(2) 次に、このキーをマスターノードに追加します。

(3) この時点で、スレーブノードでキーを再度クエリすると、マスターノードの動作がスレーブノードに同期されていることがわかります。

(4) 次に、マスターノード上のキーを削除します。

(5) この時点で、スレーブノードでキーを再度クエリすると、マスターノードの動作がスレーブノードに同期されていることがわかります。

3. レプリケーションの切断

マスターとスレーブのレプリケーション関係が、slaveof <masterip> <masterport> コマンドによって確立された後は、slaveof no one によって切断できます。スレーブノードがレプリケーションを切断した後、既存のデータは削除されませんが、マスターノードの新しいデータの変更は受け付けられなくなることに注意してください。

スレーブノードがslaveof no oneを実行した後の印刷ログは以下のようになり、レプリケーションが切断された後、スレーブノードが再びマスターノードになっていることがわかります。

マスターノードは次のようにログを出力します。

3. マスタスレーブレプリケーションの実装原理

前節ではマスター/スレーブ関係を確立するための操作方法を紹介しましたが、このセクションではマスター/スレーブレプリケーションの実装原理を紹介します。

マスタ・スレーブ・レプリケーションのプロセスは、接続確立段階（準備段階）、データ同期段階、コマンド伝播段階の 3 つの段階に大別されますので、それぞれ紹介します。

1. 接続確立フェーズ

この段階の主な機能は、マスターノードとスレーブノード間の接続を確立してデータ同期の準備をすることです。

ステップ 1: マスターノード情報を保存する

スレーブノードサーバー内には 2 つのフィールド、つまり masterhost フィールドと masterport フィールドが維持され、これらはマスターノードの IP およびポート情報を保存するために使用されます。

なお、slaveofは非同期コマンドであり、スレーブノードはマスターノードのipとポートの保存が完了すると、 slaveofコマンドを送信したクライアントに直接OKを返し、その後実際のコピー動作が開始されます。

このプロセス中に、スレーブノードが次のようにログを出力することがわかります。

ステップ 2: ソケット接続を確立する

スレーブノードは、レプリケーションタイミング関数 replicationCron() を 1 秒に 1 回呼び出し、接続可能なマスターノードが存在することを検出すると、マスターノードの IP とポートに従ってソケット接続を作成します。接続が成功した場合は、次のようになります。

スレーブノード: コピー作業を処理するソケットのファイルイベントハンドラーを作成し、RDB ファイルの受信やコマンド伝播の受信など、後続のコピー作業を担当します。

マスターノード: スレーブノードからソケット接続を受信した後 (つまり、受け入れ後)、ソケットに対応するクライアント状態を作成し、スレーブノードをマスターノードに接続されたクライアントと見なし、次の手順に基づきます。スレーブノード上でこれはコマンドリクエストをマスターノードに送信することによって行われます。

このプロセス中に、スレーブノードは次のようにログを出力します。

ステップ 3: ping コマンドを送信する

スレーブノードがマスターノードのクライアントになった後、最初のリクエストに対して ping コマンドを送信して、ソケット接続が利用可能かどうか、およびマスターノードが現在リクエストを処理できるかどうかを確認します。

スレーブノードが ping コマンドを送信した後、次の 3 つの状況が発生する可能性があります。

(1) return pong: ソケット接続が正常であり、マスターノードが現在リクエストを処理でき、レプリケーションプロセスが続行されていることを示します。

(2) タイムアウト: 一定時間が経過してもスレーブノードはマスターノードからの応答を受信せず、ソケット接続が利用できないことを示し、スレーブノードはソケット接続を切断して再接続します。

(3) pong 以外の結果を返す: マスターノードが時間外に実行されるスクリプトの処理など、マスターノードが現在コマンドを処理できないことを示す他の結果を返した場合、スレーブノードはソケット接続を切断して再接続します。

マスターノードが pong を返すと、スレーブノードは次のようにログを出力します。

ステップ 4: 認証

masterauth オプションがスレーブノードに設定されている場合、スレーブノードはマスターノードに対して認証する必要がありますが、このオプションが設定されていない場合、認証は必要ありません。スレーブノードの認証はマスターノードにauthコマンドを送信することで行われ、authコマンドのパラメータは設定ファイルのmasterauthの値となります。

マスターノードによって設定されたパスワードの状態がスレーブノードの masterauth の状態と一致する場合 (一致とは、両方が存在し、パスワードが同じであるか、どちらも存在しないことを意味します)、認証は成功し、レプリケーションプロセスが続行されます。 ; それらが矛盾している場合、スレーブノードはソケット Connect を切断し、再接続します。

ステップ 5: スレーブノードのポート情報を送信する

認証後、スレーブノードはリッスンするポート番号 (前の例では 6380) をマスターノードに送信し、マスターノードはこの情報をスレーブノードに対応するクライアントのslave_listening_port フィールドに保存します。はマスターノードには含まれません。 info Replication 実行時に表示される以外の効果はありません。

2. データ同期フェーズ

マスターノードとスレーブノード間の接続が確立された後、データ同期を開始できます。これは、スレーブノードデータの初期化として理解できます。具体的な実行方法は、スレーブノードがマスターノードにpsyncコマンドを送信し（以前はRedis2.8がsyncコマンドでした）、同期が開始されます。

データ同期ステージはマスター/スレーブレプリケーションの中核ステージです。マスター/スレーブノードの現在の状態に応じて、完全レプリケーションと部分レプリケーションに分けることができます。次の章では、これら 2 つのレプリケーション方法と実行について具体的に説明しますpsync コマンドのプロセス。ここではこれ以上の詳細はありません。

データ同期段階以前では、スレーブノードはマスターノードのクライアントであり、マスターノードはスレーブノードのクライアントではなく、この段階以降では、マスターノードとスレーブノードはクライアントになることに注意してください。お互い。その理由は、これまではマスターノードはスレーブノードからのリクエストに応答するだけで済み、積極的にリクエストを送信する必要はありませんが、データ同期フェーズとその後のコマンド伝播フェーズでは、マスターノードが要求を送信する必要があるためです。アクティブにスレーブノードにリクエスト (エリア内のプッシュバッファ書き込みコマンドなど) を送信して、コピーを完了します。

3. コマンド伝播フェーズ

データ同期フェーズが完了すると、マスター/スレーブノードはコマンド伝播フェーズに入ります。この段階で、マスターノードは実行する書き込みコマンドをスレーブノードに送信し、スレーブノードはコマンドを受信して実行します。マスター/スレーブノードのデータの一貫性。

コマンド伝播フェーズでは、書き込みコマンドの送信に加えて、マスターノードとスレーブノードはハートビートメカニズム (PING および REPLCONF ACK) も維持します。ハートビートメカニズムの原理には部分レプリケーションが含まれるため、ハートビートメカニズムについては、部分レプリケーションの関連内容を紹介した後で別途紹介します。

レイテンシーと不整合

コマンドの伝播は非同期プロセスであることに注意してください。つまり、マスターノードは書き込みコマンドを送信した後、スレーブノードからの応答を待たないため、マスターノードとマスターノードの間でリアルタイムの一貫性を維持することは実際には困難です。スレーブノードに接続されるため、遅延は避けられません。データの不整合の程度は、マスターノードとスレーブノード間のネットワークの状態、マスターノードの書き込みコマンドの実行頻度、マスターノードの repl-disable-tcp-nolay 設定に関連します。

repl-disable-tcp-nolay no: この設定は、マスターノードがスレーブノードとの TCP_NODELAY を禁止するかどうかを制御するためにコマンド伝播フェーズで使用されます。デフォルトは no、つまり TCP_NODELAY は禁止されていません。「はい」に設定すると、TCP はパケットをマージして帯域幅を削減しますが、送信頻度が減少し、スレーブノードのデータ遅延が増加し、一貫性が低下します。特定の送信頻度は Linux カーネルの構成に関連します。、デフォルト設定は 40ms です。no に設定すると、TCP はマスターノードのデータをすぐにスレーブノードに送信し、帯域幅は増加しますが、遅延は小さくなります。

一般に、アプリケーションが Redis データの不整合に対して高い耐性を持ち、マスターノードとスレーブノード間のネットワーク状態が良好でない場合にのみ、yes に設定されます。ほとんどの場合、デフォルト値の no が使用されます。

4. [データ同期フェーズ] フルコピーと部分コピー

Redis2.8 より前では、スレーブノードはマスターノードに sync コマンドを送信してデータの同期を要求し、このときの同期方法はフルコピーでしたが、Redis2.8 以降では、スレーブノードが psync コマンドを送信してデータを要求できるようになりました。同期、現時点ではマスター/スレーブノードに応じて現在のステータスに応じて、同期方法は完全レプリケーションまたは部分レプリケーションになる場合があります。以下の紹介では、Redis 2.8 以降のバージョンを例として取り上げます。

フルレプリケーション: 初期レプリケーションまたは部分レプリケーションが不可能なその他の状況に使用されます。マスターノード内のすべてのデータをスレーブノードに送信することは、非常に負荷の高い操作です。
部分レプリケーション: ネットワーク中断などの後のレプリケーションに使用され、中断中にマスターノードが実行した書き込みコマンドのみがスレーブノードに送信されるため、フルレプリケーションよりも効率的です。ネットワーク中断時間が長すぎて、マスターノードが中断中に実行された書き込みコマンドを完全に保存できない場合、部分レプリケーションは実行できず、完全レプリケーションが引き続き使用されることに注意してください。

1. フルコピー

psync コマンドを使用した Redis 完全レプリケーションのプロセスは次のとおりです。

(1) スレーブノードが部分レプリケーション不可と判断しマスターノードに完全レプリケーション要求を送信するか、スレーブノードが部分レプリケーション要求を送信するがマスターノードが部分レプリケーション不可と判断するか、具体的な判断部分レプリケーション導入の原理を説明した後にプロセスを説明する必要があります。

(2) マスターノードはフルコピーコマンドを受信した後、bgsave を実行し、バックグラウンドで RDB ファイルを生成し、バッファ (コピーバッファと呼ばれます) を使用して、今後実行されるすべての書き込みコマンドを記録します。

(3) マスターノードの bgsave 実行完了後、RDB ファイルをスレーブノードに送信すると、スレーブノードは古いデータをクリアした後、受信したRDBファイルをロードし、データベースの状態をデータ保存時のデータベースの状態に更新します。マスターノードが bgsave を実行する

(4) マスターノードは前述のコピーバッファ内のすべての書き込みコマンドをスレーブノードに送信し、スレーブノードはこれらの書き込みコマンドを実行してデータベースの状態をマスターノードの最新の状態に更新します。

(5) スレーブノードで AOF が有効になっている場合、bgrewriteaof の実行がトリガーされ、AOF ファイルがマスターノードの最新の状態に更新されるようになります。

以下は、完全レプリケーションの実行時にマスターノードとスレーブノードによって出力されるログです。ログの内容が上記の手順に正確に対応していることがわかります。

マスターノードの印刷ログは以下のとおりです。

ノードからのログは、次の図に示すように出力されます。

その中で、注意すべき点がいくつかあります: スレーブノードはマスターノードから 89260 バイトのデータを受信しました; スレーブノードはマスターノードからデータをロードする前に古いデータをクリアする必要があります; スレーブノードがデータを同期した後、bgrewriteaof を呼び出します。

フルコピーのプロセスを通して、フルコピーが非常に重い操作であることがわかります。

(1) マスターノードは bgsave コマンドを使用して子プロセスをフォークし、RDB 永続化を実行します。このプロセスは大量の CPU、メモリ (ページテーブルコピー)、およびハードディスク IO を消費します。bgsave のパフォーマンスについては、以下を参照してください。 Redis の詳細な研究: 永続性

(2) マスターノードはネットワーク経由でRDBファイルをスレーブノードに送信します。これにより、マスターノードとスレーブノードの帯域幅が大量に消費されます。

(3) 古いデータをクリアしてスレーブノードから新しい RDB ファイルをロードするプロセスがブロックされ、クライアントコマンドに応答できなくなります。スレーブノードが bgrewriteaof を実行すると、追加の消費も発生します。

2. 部分コピー

マスターノードに大量のデータがある場合、完全レプリケーションは非効率すぎるため、Redis 2.8 では、ネットワークが中断された場合にデータ同期を処理するために部分レプリケーションの提供を開始しました。

部分レプリケーションの実現は、次の 3 つの重要な概念に依存しています。

(1) コピーオフセット

マスターノードとスレーブノードはそれぞれ、マスターノードからスレーブノードに渡されるバイト数を表すレプリケーションオフセット (オフセット) を維持します。マスターノードが N バイトのデータをスレーブノードに送信するたびに、オフセットはマスターノードは N を増加させ、スレーブノードがマスターノードから N バイトのデータを受信するたびに、スレーブノードのオフセットは N ずつ増加します。

オフセットは、マスターノードとスレーブノードのデータベースの状態が一致しているかどうかを判断するために使用され、両者のオフセットが同じであれば一致しており、オフセットが異なっていれば不一致となります。スレーブノードからの距離は、2 つのオフセットに従って見つけることができます。たとえば、マスターノードのオフセットが 1000、スレーブノードのオフセットが 500 の場合、部分レプリケーションではオフセット 501 ～ 1000 のデータをスレーブノードに転送する必要があります。オフセット 501 ～ 1000 のデータが格納される場所が、以下で紹介するレプリケーションバックログバッファです。

(2) バックログバッファをコピーする

レプリケーションバックログバッファは、マスターノードによって維持される固定長の先入れ先出し (FIFO) キューで、デフォルトサイズは 1MB です。マスターノードがスレーブノードを持ち始めるときに作成され、その機能はこれは、マスターノードからスレーブノードに最近送信されたデータをバックアップすることです。マスターに 1 つ以上のスレーブがあるかどうかに関係なく、必要なレプリケーションバックログバッファーは 1 つだけであることに注意してください。

コマンド伝播フェーズでは、書き込みコマンドをスレーブノードに送信するだけでなく、マスターノードも書き込みコマンドのバックアップとしてレプリケーションバックログバッファにコピーを送信し、書き込みコマンドを保存するだけでなく、それぞれのレプリケーションバックログバッファにも格納されます。このバイトはコピーオフセット (オフセット) に対応します。レプリケーションバックログバッファーは固定長で先入れ先出し方式であるため、プライマリノードによって実行された最新の書き込みコマンドが保存され、古い書き込みコマンドはバッファーから押し出されます。

バッファの長さは固定で制限されているため、バックアップできる書き込みコマンドも制限され、マスタとスレーブのノードオフセット間のギャップが大きすぎてバッファ長を超えた場合、部分レプリケーションを実行できません。また、完全なレプリケーションのみを実行できます。逆に、ネットワークが中断されたときに部分レプリケーションが実行される確率を高めるために、必要に応じてレプリケーションバックログバッファのサイズを増やすことができます (repl-backlog-size を構成することで)。たとえば、ネットワーク中断の平均時間がは 60 秒であり、1 秒あたりに生成される書き込みコマンド (特定のプロトコル形式) によって占有される平均バイト数は 100KB で、コピーバックログバッファの平均需要は 6MB です。安全のため、次のように設定できます。 12MB を確保すると、ほとんどの切断状況でも部分コピーを使用できます。

スレーブノードがマスターノードにオフセットを送信した後、マスターノードはオフセットとバッファサイズに従って部分レプリケーションを実行するかどうかを決定します。

オフセット offset 以降のデータがまだコピーバックログバッファーにある場合は、部分コピーを実行します。
オフセット offset 以降のデータがコピーバックログバッファーにない (データが絞り出されている) 場合は、フルコピーを実行します。

(3) サーバ実行ID(runid)

各 Redis ノード (マスターとスレーブに関係なく) は、起動時に 40 個のランダムな 16 進文字で構成されるランダム ID (起動ごとに異なります) を自動的に生成します。runid は、Redis ノードを一意に識別するために使用されます。info Server コマンドを使用して、ノードの runid を表示できます。

マスター/スレーブノードが初めて複製されるとき、マスターノードは自身の runid をスレーブノードに送信し、スレーブノードは runid を保存します。切断して再接続すると、スレーブノードは runid をマスターノードに送信します。いいえ部分コピー:

スレーブノードによって保存された runid がマスターノードの現在の runid と同じである場合、それはマスター/スレーブノードが以前に同期されていることを意味し、マスターノードは引き続き部分レプリケーションの使用を試行します (部分レプリケーションが可能かどうかに関係なく)。部分的にレプリケートされるかどうかは、オフセットとレプリケーションバックログバッファーによって異なります)。
スレーブノードが保存したrunidがマスターノードの現在のrunidと異なる場合は、切断前にスレーブノードが同期していたRedisノードが現在のマスターノードではないことを意味し、フルコピーのみ可能となります。

3. psyncコマンドの実行

レプリケーションオフセット、レプリケーションバックログバッファ、ノード実行 ID を理解した後、このセクションでは psync コマンドのパラメータと戻り値を紹介し、マスター/スレーブノードが完全レプリケーションと部分レプリケーションのどちらを使用するかを決定する方法を説明します。の psync コマンドの実行中。

psync コマンドの実行プロセスを以下の図に示します (画像出典:「Redis Design and Implementation」)。

(1) まず、スレーブノードは、現在の状態に応じて psync コマンドを呼び出す方法を決定します。

スレーブノードがこれまでにslaveofを実行していないか、最近誰にもslaveofを実行していない場合、スレーブノードはコマンド psync ? -1 を送信してマスターノードからの完全なレプリケーションを要求します。
スレーブノードが以前に smileof を実行したことがある場合、送信するコマンドは psync <runid> <offset> です。ここで、runid は最後にレプリケートされたマスターノードの runid、offset は最後のレプリケーション時にスレーブノードによって保存されたレプリケーションオフセットです。期限切れ。

(2) マスターノードは、受信した psync コマンドと現在のサーバーのステータスに基づいて、完全レプリケーションを実行するか部分レプリケーションを実行するかを決定します。

マスターノードのバージョンが Redis2.8 より低い場合、-ERR 応答が返されます。このとき、スレーブノードは完全レプリケーションを実行するために同期コマンドを再送信します。
マスターノードのバージョンが十分に新しく、runid がスレーブノードによって送信された runid と同じで、スレーブノードによって送信されたオフセット以降のデータがレプリケーションバックログバッファーに存在する場合は、部分的であることを示す +CONTINUE を応答します。レプリケーションが実行され、スレーブノードはマスターを待ちます。ノードは欠落したデータを送信します。
マスターノードのバージョンが十分に新しいが、runid がスレーブノードによって送信された runid と異なる場合、またはスレーブノードによって送信されたオフセット以降のデータがレプリケーションバックログバッファーに存在しない (キューに押し出された) 場合、 +FULLRESYNC <runid> <offset> と応答すると、フルコピーを実行することを意味します。runid はマスターノードの現在の runid を示し、offset はマスターノードの現在のオフセットを示し、スレーブノードは将来の使用のためにこれら 2 つの値を保存します。。

4. デモを部分的に再現する

以下のデモでは、数分間のネットワーク停止後に切断されたマスター/スレーブノードが部分的に複製されます。ネットワーク停止をシミュレートするために、この例のマスター/スレーブノードはローカルエリアネットワーク内の 2 台のマシン上にあります。

ネットワークの中断

ネットワークが一定時間中断されると、マスターノードとスレーブノードの両方が相互接続を失ったことに気づきます (マスター/スレーブノードのタイムアウトの判断メカニズムについては後述します)。、スレーブノードはマスターノードへの再接続を開始します。この時点ではネットワークが回復していないため、再接続は失敗し、スレーブノードは常に再接続を試みます。

メインノードのログは次のとおりです。

スレーブノードのログは次のとおりです。

ネットワークの回復

ネットワークが復旧すると、スレーブノードはマスターノードに正常に接続して部分レプリケーションを要求し、マスターノードが要求を受信すると、両者は部分レプリケーションを実行してデータを同期します。

メインノードのログは次のとおりです。

スレーブノードのログは次のとおりです。

5. 【コマンド伝播フェーズ】ハートビートの仕組み

コマンド伝播フェーズでは、書き込みコマンドの送信に加えて、マスターノードとスレーブノードはハートビートメカニズム (PING および REPLCONF ACK) も維持します。ハートビート機構はマスタスレーブレプリケーションのタイムアウト判定やデータセキュリティに役立ちます。

1. マスター→スレーブ: PING

マスターノードは指定時間ごとにスレーブノードに対してPINGコマンドを送信しますが、このPINGコマンドの役割は主にスレーブノードがタイムアウトを判定することです。

PING 送信の頻度は、repl-ping-slave-period パラメーターによって秒単位で制御され、デフォルト値は 10 秒です。

PING コマンドがマスターノードからスレーブノードに送信されるか、またはその逆かについてはいくつかの議論があります。公式の Redis ドキュメントでは、パラメーターのコメントにスレーブノードがマスターノードに PING コマンドを送信すると記載されているため、以下の図に示すように:

しかし、パラメータの名前（ping-slaveを含む）とコードの実装によると、PINGコマンドはマスターノードからスレーブノードに送信されると思います。関連するコードは次のとおりです。

2. スレーブ -> マスター: REPLCONF ACK

コマンド伝播フェーズでは、スレーブノードは 1 秒に 1 回の頻度でREPLCONF ACKコマンドをマスターノードに送信します。コマンドの形式は次のとおりです: REPLCONF ACK {offset}、ここでの offset はスレーブノードによって保存されたレプリケーションオフセットを指します。REPLCONF ACK コマンドの機能は次のとおりです。

(1) マスタノードとスレーブノードのネットワーク状態のリアルタイム監視: このコマンドはマスタノードがレプリケーションのタイムアウトを判断するために使用します。さらに、マスターノードで info Replication を使用すると、マスターノードが最後に REPLCONF ACK コマンドを受信した時間間隔を表すスレーブノードのステータスのラグ値を確認できます。通常の状況では、この値は 0 である必要があります。または、以下に示すように 1。

(2) コマンドロス検出: スレーブノードが自身のオフセットを送信し、マスターノードが自身のオフセットと比較し、スレーブノードのデータが欠落している場合(ネットワークパケットロスなど)、マスターノードが欠落データをプッシュします。 (ここでもレプリケーションバックログバッファーを使用します)。オフセットおよびコピーバックログバッファは、部分コピーだけでなく、コマンド損失などの状況に対処するためにも使用できることに注意してください。違いは、前者は切断および再接続後に実行されるのに対し、後者は切断および再接続後に実行されることです。この状況下では、マスターノードとスレーブノードは切断されません。

(3) 補助はスレーブノードの数と遅延を保証します。Redis マスターノードは min-slaves-to-write パラメーターと min-slaves-max-lag パラメーターを使用して、マスターノードが安全でない状況で書き込みコマンドを実行しないようにします。いわゆる安全でないとは、スレーブノードの数が少なすぎるか、遅延が大きすぎることを意味します。たとえば、min-slaves-to-write と min-slaves-max-lag はそれぞれ 3 と 10 です。これは、スレーブノードの数が 3 未満であるか、すべてのスレーブノードの遅延値が 10 秒を超えていることを意味します。場合、マスターノードは書き込みコマンドの実行を拒否します。ここでのスレーブノードのディレイ値の取得は、マスタノードがREPLCONF ACKコマンドを受信した時刻、つまり前述のinfo Replicationにおけるラグ値によって判断される。

6. アプリケーションの問題点

1. 読み書き分離とその問題点

マスター/スレーブレプリケーションに基づく読み取りと書き込みの分離により、Redis の読み取り負荷分散を実現できます。マスターノードは書き込みサービスを提供し、1 つ以上のスレーブノードは読み取りサービスを提供します (複数のスレーブノードはデータの冗長性を向上させ、読み取り負荷を最大化することもできます)容量); 読み取り負荷が大きいアプリケーションシナリオでは、Redis サーバーの同時実行性を大幅に向上させることができます。Redis の読み取り/書き込み分離を使用する場合に注意する必要がある問題を次に紹介します。

(1) 遅延と不整合の問題

前述したように、マスター/スレーブレプリケーションのコマンド伝播は非同期であるため、遅延とデータの不一致は避けられません。アプリケーションによるデータの不整合の許容度が低い場合は、マスターノードとスレーブノード間のネットワーク環境の最適化 (同じコンピュータールームに展開するなど)、マスターノードとスレーブノードの遅延を (オフセットによって) 監視して、値が大きすぎる場合は、スレーブノードを介してデータを読み取らないようにアプリケーションに通知し、クラスターを使用して書き込み負荷と読み取り負荷を同時に拡張します。

スレーブノードのデータの不整合は、接続がデータ同期フェーズにあるときや、スレーブノードがマスターノードとの接続を失ったときなど、コマンド伝播フェーズ以外の他の状況でより深刻になる可能性があります。スレーブノードのslave-serve-stale-dataパラメータはこれに関連しています: この場合、これはスレーブノードのパフォーマンスを制御します; これがyes (デフォルト値) の場合、スレーブノードは引き続きクライアントのコマンドに応答できます。 noの場合、スレーブノードはinfoやslaveofなどのいくつかのコマンドにのみ応答できます。このパラメータの設定は、アプリケーションのデータ整合性要件に関連しています。データ整合性要件が非常に高い場合は、「いいえ」に設定する必要があります。

(2) データ有効期限問題

Redis のスタンドアロンバージョンでは、2 つの削除戦略があります。

遅延削除: サーバーはデータを積極的に削除せず、クライアントが特定のデータをクエリした場合にのみ、サーバーがデータの有効期限が切れているかどうかを判断し、有効期限が切れている場合は削除します。
定期的な削除: サーバーはスケジュールされたタスクを実行して期限切れのデータを削除しますが、メモリと CPU の間の妥協点 (削除するとメモリは解放されますが、頻繁な削除操作は CPU に優しくありません) を考慮して、この削除の頻度と実行時間は制限されます。

マスター/スレーブレプリケーションシナリオでは、マスターノードとスレーブノードのデータの整合性を確保するために、スレーブノードはデータを積極的に削除しませんが、マスターノードはスレーブノード内の期限切れデータの削除を制御します。マスターノードの遅延削除と定期的な削除戦略により、マスターノードは期限切れのデータを適時に削除することを保証できません。そのため、クライアントが Redis 経由でノードからデータを読み取る場合、簡単に削除できます。期限切れのデータを読み取ります。

Redis 3.2 では、スレーブノードがデータを読み取るときに、データの有効期限が切れているかどうかの判断が追加されます。データの有効期限が切れている場合、データはクライアントに返されません。Redis を 3.2 にアップグレードすると、データの有効期限の問題を解決できます。

(3) フェイルオーバーの問題

Sentinel を使用しない読み取り/書き込み分離シナリオでは、アプリケーションは読み取りと書き込みのために異なる Redis ノードに接続します。マスターノードまたはスレーブノードに問題が発生して変更された場合、読み取りと書き込みを行うためにアプリケーションの接続を変更する必要があります。 Redis データを時間内に接続; 接続の切り替え手動で切り替えることも、監視プログラムを自分で作成することによって切り替えることもできますが、前者は応答が遅くエラーが発生しやすく、後者は実装が複雑でコストも低くありません。

(4) まとめ

読み取りと書き込みの分離を使用する前に、Redis の読み取り負荷容量を増やす他の方法を検討できます。たとえば、マスターノードを可能な限り最適化する (遅いクエリを減らし、永続性などの他の状況によって引き起こされるブロックを減らす) などです。負荷容量の向上、Redis クラスターを使用して読み取り負荷容量を同時に増加させる負荷容量と書き込み負荷容量など。読み取りと書き込みの分離を使用する場合、センチネルを使用してマスターノードとスレーブノードのフェイルオーバーを可能な限り自動化し、アプリケーションへの侵入を減らすことができます。

2. レプリケーションのタイムアウトの問題

マスター/スレーブノードのレプリケーションタイムアウトは、レプリケーション中断の最も重要な理由の 1 つです。このセクションではタイムアウトの問題について個別に説明し、次のセクションではレプリケーション中断の原因となる可能性のあるその他の問題について説明します。

タイムアウト判定の意味

レプリケーション接続の確立中および確立後に、マスターノードとスレーブノードには、接続がタイムアウトしたかどうかを判断するメカニズムが備わっています。これは、次のことを意味します。

(1) マスターノードが接続がタイムアウトしたと判断した場合、対応するスレーブノードの接続を解放し、さまざまなリソースを解放します。そうでない場合、無効なスレーブノードは引き続きマスターノードのさまざまなリソース（出力バッファ、帯域幅）を占有します。また、接続タイムアウトの判定により、マスターノードは現在有効なスレーブノードの数をより正確に知ることができ、データセキュリティの確保に役立ちます（min-slaves-toなどのパラメータと連携してください） -上記のことを書いてください）。

(2) スレーブノードは、接続がタイムアウトしたと判断した場合、マスターノードのデータとの長期にわたる不一致を回避するために、時間内に接続を再確立できます。

判断の仕組み

マスター/スレーブレプリケーションのタイムアウト判定の中核は repl-timeout パラメータにあり、これはタイムアウトしきい値 (デフォルトでは 60 秒) を指定します。これはマスターノードとスレーブノードの両方で有効であり、マスター/スレーブノードがトリガーされる条件です。タイムアウトは次のとおりです。

(1) マスタノード：レプリケーションタイミング関数 replicationCron()を 1 秒に 1 回呼び出し、現在時間が各スレーブノードから最後に REPLCONF ACK を受信してからの repl-timeout 値より長いかどうかを判定し、したがって、ノードから対応する接続を解放します。

(2) スレーブノード：スレーブノードのタイムアウト判定もレプリケーションタイミング機能で判定します基本ロジックは以下の通りです。

現在接続確立フェーズにあり、最後にマスターノードから情報を受信してからの時間が repl-timeout を超えている場合は、マスターノードとの接続を解放します。
現在データ同期段階にあり、マスターノードからの RDB ファイルの受信時間がタイムアウトになった場合は、データ同期を停止して接続を解放します。
現在コマンド伝播フェーズにあり、最後にマスターノードから PING コマンドまたはデータを受信してからの時間が repl-timeout 値を超えている場合は、マスターノードとの接続を解放します。

接続タイムアウトを判断するマスター/スレーブノードの関連ソースコードは次のとおりです。

/* Replication cron function, called 1 time per second. */

void replicationCron(void) {

    static long long replication_cron_loops = 0;



    /* Non blocking connection timeout? */

    if (server.masterhost &&

        (server.repl_state == REDIS_REPL_CONNECTING ||

         slaveIsInHandshakeState()) &&

         (time(NULL)-server.repl_transfer_lastio) > server.repl_timeout)

    {

        redisLog(REDIS_WARNING,"Timeout connecting to the MASTER...");

        undoConnectWithMaster();

    }



    /* Bulk transfer I/O timeout? */

    if (server.masterhost && server.repl_state == REDIS_REPL_TRANSFER &&

        (time(NULL)-server.repl_transfer_lastio) > server.repl_timeout)

    {

        redisLog(REDIS_WARNING,"Timeout receiving bulk data from MASTER... If the problem persists try to set the 'repl-timeout' parameter in redis.conf to a larger value.");

        replicationAbortSyncTransfer();

    }



    /* Timed out master when we are an already connected slave? */

    if (server.masterhost && server.repl_state == REDIS_REPL_CONNECTED &&

        (time(NULL)-server.master->lastinteraction) > server.repl_timeout)

    {

        redisLog(REDIS_WARNING,"MASTER timeout: no data nor PING received...");

        freeClient(server.master);

    }



    //此处省略无关代码……



    /* Disconnect timedout slaves. */

    if (listLength(server.slaves)) {

        listIter li;

        listNode *ln;

        listRewind(server.slaves,&li);

        while((ln = listNext(&li))) {

            redisClient *slave = ln->value;

            if (slave->replstate != REDIS_REPL_ONLINE) continue;

            if (slave->flags & REDIS_PRE_PSYNC) continue;

            if ((server.unixtime - slave->repl_ack_time) > server.repl_timeout)

            {

                redisLog(REDIS_WARNING, "Disconnecting timedout slave: %s",

                    replicationGetSlaveName(slave));

                freeClient(slave);

            }

        }

    }



    //此处省略无关代码……



}

注意すべきピット

レプリケーションフェーズ中の接続タイムアウトに関連する実際的な問題をいくつか次に示します。

(1) データ同期段階: マスター/スレーブノードが bgsave のフルコピーを実行する場合、マスターノードはまず子プロセスをフォークして現在のデータを RDB ファイルに保存し、次に RDB ファイルをスレーブノードに転送する必要があります。ネットワークを通じて。RDBファイルが大きすぎると、マスターノードが子プロセスのfork＋RDBファイルの保存に時間がかかりすぎ、スレーブノードが長時間データの受信に失敗してタイムアウトが発生する可能性がありますが、このとき、スレーブノードはマスターノードに再接続し、その後再びフルになります。レプリケーション、タイムアウト、再接続...これは悲しいサイクルです。この状況を回避するには、Redis スタンドアロンのデータ量が大きすぎないことに注意することに加えて、repl-timeout 値を適切に増やす必要があります。 bgsave には時間がかかります。

(2) コマンド伝播フェーズ: 前述したように、このフェーズでは、マスターノードがスレーブノードに PING コマンドを送信し、頻度は repl-ping-slave-period によって制御されます。このパラメータは、 repl-timeout 値 (後者は前者の少なくとも数倍です)。2 つのパラメータが等しいか近い場合、ネットワークジッターにより個々の PING コマンドが失われますが、このときマスターノードはスレーブノードにデータを送信せず、スレーブノードはタイムアウトを簡単に判断できます。

(3) 遅いクエリによるブロック: マスターノードまたはスレーブノードがいくつかの遅いクエリ (ビッグデータの key * や hgetall など) を実行すると、サーバーがブロックされ、レプリケーションがタイムアウトになります。

3. レプリケーション中断問題

マスター/スレーブノードのタイムアウトは、レプリケーション中断の原因の 1 つですが、レプリケーション中断を引き起こす可能性のある状況は他にもありますが、その中で最も重要なのはレプリケーションバッファオーバーフローの問題です。

コピーバッファオーバーフロー

前述したように、フルコピーフェーズでは、マスターノードは実行された書き込みコマンドをレプリケーションバッファーに置き、このバッファーに格納されたデータには、次の期間にマスターノードによって実行された書き込みコマンドが含まれます。 bgsave は RDB ファイルを生成します。 RDB ファイルはマスターノードからスレーブノードに送信され、スレーブノードは古いデータをクリアして RDB ファイルにデータをロードします。マスターノードに大量のデータがある場合、またはマスターノードとスレーブノード間のネットワーク遅延が大きい場合、バッファのサイズが制限を超える可能性があり、この時点でマスターノードはスレーブノードから切断されます。フルコピー -> コピーバッファオーバーフローによる接続中断 -> 再接続 -> フルコピー -> コピーバッファオーバーフローによる接続中断...というサイクルが発生する可能性があります。

コピーバッファのサイズは、client-output-buffer-limit スレーブ {ハードリミット} {ソフトリミット} {ソフト秒} によって構成されます。デフォルト値は client-output-buffer-limit スレーブ 256MB 64MB 60 です。これは、次のことを意味します。バッファーが 256MB を超えるか、60 秒連続で 64MB を超えると、マスターノードはスレーブノードから切断されます。このパラメーターは、config set コマンドを使用して動的に構成できます (つまり、Redis を再起動しなくても有効になります)。

レプリケーションバッファーがオーバーフローすると、マスターノードは次のようにログを出力します。

コピーバッファはクライアント出力バッファの一種であり、マスターノードは各スレーブノードにコピーバッファを割り当てますが、コピーバックログバッファは、スレーブノードがいくつあっても、マスターノードは 1 つだけであることに注意してください。

4. 各シナリオにおけるレプリケーションの選択と最適化手法

Redis レプリケーションの詳細を紹介した後、部分レプリケーションをいつ使用するか、および次の一般的なシナリオでどのような問題に注意する必要があるかを要約できます。

(1) 初めてコピーを作成する

現時点では完全なレプリケーションは避けられませんが、マスターノードに大量のデータがある場合は、輻輳を避けるためにトラフィックのピーク時間帯を避けるようにしてください。複数のスレーブノードがある場合は、注意すべき点がいくつかあります。マスターノードのレプリケーションを確立する必要がある場合は、マスターノードの過度の帯域幅占有を避けるために、複数のスレーブノードをずらすことを検討できます。さらに、スレーブノードが多すぎる場合は、マスター/スレーブレプリケーションのトポロジを調整して、マスター/複数スレーブ構造からツリー構造に変更することもできます (中間ノードはマスターノードのスレーブノードであり、ただし、ツリー構造を使用する場合は、マスターノードの直接のスレーブノードの数が減り、マスターノードの負担は軽減されますが、マルチノードの遅延が大きくなることに注意する必要があります。階層スレーブノードが増えてデータの整合性が悪くなり、構造が複雑になりメンテナンスが非常に困難になります。

(2) マスターノードの再起動

マスターノードの再起動は、障害によるダウンタイムと計画的な再起動の 2 つの状況に分けて説明します。

マスターノードがダウンしている

マスターノードが停止して再起動されると、runid が変更されるため、部分レプリケーションは実行できなくなり、完全レプリケーションのみが可能になります。

実際、マスターノードがダウンした場合は、フェイルオーバー処理が実行され、スレーブノードの 1 つがマスターノードにアップグレードされ、他のスレーブノードは新しいマスターノードからコピーされ、フェイルオーバーは自動化される必要があります。次の記事で紹介するように、Sentinel は自動フェイルオーバーを実行できます。

安全な再起動: デバッグのリロード

シナリオによっては、マスターノードのメモリ断片化率が高すぎる場合や、起動時にのみ調整できる一部のパラメーターを調整する場合など、マスターノードを再起動する必要がある場合があります。通常の方法でマスターノードを再起動すると runid が変更され、不必要な完全レプリケーションが発生する可能性があります。

この問題を解決するために、Redis はデバッグリロードの再起動メソッドを提供します。再起動後、マスターノードのrunidとオフセットは影響を受けず、完全なレプリケーションが回避されます。

次の図に示すように、デバッグリロードの再起動後、runid と offset は影響を受けません。

ただし、デバッグリロードは諸刃の剣で、カレントメモリ上のデータをクリアしてRDBファイルから再ロードすることにより、マスターノードの閉塞を引き起こすため注意が必要です。

(3) ノードからの再起動

スレーブノードがダウンして再起動すると、スレーブノードが保存していたマスターノードのrunidが失われるため、再度slaveofを実行しても部分レプリケーションは行えません。

(4) ネットワークの中断

マスターノードとスレーブノードの間にネットワークの問題があり、短期間のネットワーク中断が発生する場合は、複数の状況に分けて議論することができます。

ケース 1: ネットワークの問題は非常に短期間で発生し、短期間のパケット損失のみが発生し、マスターノードもスレーブノードもタイムアウトを判断していません (repl-timeout がトリガーされていません)。現時点では、タイムアウトだけが発生しています。 REPLCONF ACK を通じて失われたデータを補うために必要です。

2 番目の状況: ネットワークの問題が長時間続き、マスター/スレーブノードがタイムアウトと判断し (repl-timeout がトリガーされる)、失われたデータが多すぎてレプリケーションバックログバッファーの保存範囲を超えます。この時点では、、マスター/スレーブノードは部分コピーはできず、完全コピーのみです。この状況を可能な限り回避するには、レプリケーションバックログバッファのサイズを実際の状況に応じて適切に調整する必要があります。また、ネットワーク中断をタイムリーに検出して修復することで、完全なレプリケーションを減らすこともできます。

3 番目のケース: 上記 2 つのケースの間で、マスタ/スレーブノードの判定がタイムアウトになり、失われたデータがレプリケーションバックログバッファに残っている場合、この時点ではマスタ/スレーブノードは部分レプリケーションを実行できます。

5. 関連設定のコピー

ここでは、レプリケーションに関連する設定をまとめ、各設定の機能、動作フェーズ、設定方法などを説明し、これらの設定を理解することで、Redis レプリケーションについての理解が深まる一方で、一方、これらの構成の方法をマスターすると、Redis の使用を最適化し、落とし穴を回避できます。

構成は大きく分けて、マスターノードに関する構成、スレーブノードに関する構成、およびマスターノードとスレーブノードの両方に関する構成に分けて説明します。

(1) マスターノードとスレーブノードの両方に関する設定

最も具体的な構成が最初に導入され、ノードがマスターかスレーブかを決定します。

1) smileof <masterip> <masterport>: Redis の起動時に機能します; この機能はレプリケーション関係を確立することであり、この構成がオンになっている Redis サーバーは起動後にスレーブノードになります。このコメントはデフォルトでコメントアウトされます。つまり、Redis サーバーがデフォルトでマスターノードになります。

2) repl-timeout 60: 各段階でのマスター/スレーブノード接続のタイムアウト判定に関連します。前の紹介を参照してください。

(2) マスターノード関連の設定

1) repl-diskless-sync no: フルレプリケーションフェーズで使用され、プライマリノードがディスクレスレプリケーション (ディスクレスレプリケーション) を使用するかどうかを制御します。いわゆるディスクレスレプリケーションとは、完全レプリケーション中に、マスターノードが最初にデータを RDB ファイルに書き込むのではなく、スレーブのソケットに直接書き込むことを意味します。プロセス全体にハードディスクは関与しません。ディスクレスレプリケーションは、ディスク IO とネットワーク速度が遅い速いほど有利です。Redis 3.0 の時点では、ディスクレスレプリケーションは実験段階にあり、デフォルトでは無効になっていることに注意してください。

2) repl-diskless-sync-delay 5: この設定は完全なレプリケーションフェーズに適用されます。マスターノードがディスクレスレプリケーションを使用する場合、この設定はマスターノードがスレーブノードに送信する前の一時停止時間を秒単位で決定します (ディスクレスの場合のみ)。レプリケーションが有効です。有効です。デフォルトは 5 秒です。一時停止時間が設定される理由は、次の 2 つの考慮事項に基づいています。 (1) スレーブのソケットへの送信が開始されると、新しく接続されたスレーブは、新しいデータを開始する前に現在のデータ送信の終了を待つことしかできません。 (2) 複数のスレーブノード短時間でマスター/スレーブレプリケーションを確立できる可能性が高くなります。

3) client-output-buffer-limit スレーブ 256MB 64MB 60: フルコピーフェーズのマスターノードのバッファサイズに関連します。前の紹介を参照してください。

4) repl-disable-tcp-nolay no: コマンド伝播フェーズの遅延に関連します。前の紹介を参照してください。

5) masterauth <master-password>: 接続確立フェーズの ID 検証に関連します。前の紹介を参照してください。

6) repl-ping-slave-period 10: コマンド伝播フェーズにおけるマスター/スレーブノードのタイムアウト判定に関連します。前の紹介を参照してください。

7) repl-backlog-size 1mb: レプリケーションバックログバッファーのサイズ。前の説明を参照してください。

8) repl-backlog-ttl 3600: マスターノードにスレーブノードがない場合、切断されたスレーブノードが再接続したときに部分的なレプリケーションを実行できるように、レプリケーションバックログバッファーを保持する時間。デフォルトは 3600 秒です。0 に設定すると、コピーバックログバッファは解放されません。

9) min-slaves-to-write 3 および min-slaves-max-lag 10: マスターノードのスレーブノードの最小数と、対応する最大遅延を指定します。前の説明を参照してください。

(3) スレーブノード関連の設定

1）slave-serve-stale-data yes: データが古いときにスレーブノードがクライアントコマンドに応答するかどうかに関連します。前の紹介を参照してください。

2) スレーブ読み取り専用はい: スレーブノードが読み取り専用かどうか; デフォルトは読み取り専用です。スレーブノードが書き込み動作を開始すると、マスターノードとスレーブノードのデータが不整合になる可能性が高いため、この構成はできるだけ変更しないでください。

6. スタンドアロンのメモリサイズ制限

「Deep Learning Redis、Redis Persistence」の記事では、Redis スタンドアロンマシンのメモリサイズに対するフォーク操作の制限について説明しました。実際、Redis の使用には、スタンドアロンメモリのサイズを制限する多くの要因があります。マスター/スレーブレプリケーションにおける過剰なスタンドアロンメモリの考えられる影響を以下にまとめます。

(1) マスターカット: マスターノードがダウンした場合、一般的な災害復旧戦略は、スレーブノードの 1 つをマスターノードに昇格させ、他のスレーブノードを新しいマスターノードにマウントすることです。スタンドアロンのメモリが 10GB に達すると、スレーブノードの同期時間は数分レベルになりますが、スレーブノードの数が増えると、回復速度が遅くなります。システムの読み取り負荷が高く、この期間にスレーブノードがサービスを提供できない場合、システムに多大な負荷がかかります。

(2) スレーブライブラリの拡張：トラフィックが急激に増加した場合、読み込み負荷を分散するためにスレーブノードを増やすことが望ましいですが、データ量が多すぎるとスレーブノードの同期が遅すぎて対応が困難になります。タイムリーにトラフィックが突然増加します。

(3) バッファオーバーフロー: (1) と (2) はどちらも、スレーブノードは正常に同期できますが (遅いですが)、データ量が多すぎるとマスターノードのレプリケーションバッファが満杯になる場合です。レプリケーションフェーズがオーバーフローしてレプリケーションが中断されると、マスター/スレーブノードのデータ同期が完全にレプリケーションされます -> レプリケーションバッファオーバーフローによりレプリケーションが中断されます -> 再接続 -> 完全レプリケーション -> レプリケーションバッファオーバーフローによりレプリケーションが中断されます。 ..サイクル。

(4) タイムアウト: データ量が大きすぎると、フルコピーフェーズでマスターノードが RDB ファイルをフォークして保存するのに時間がかかりすぎ、スレーブノードは長時間データを受信できずにタイムアウトが発生します。、マスター/スレーブノードのデータ同期も、フルコピー→タイムアウトによりレプリケーション中断→再接続→フルレプリケーション→タイムアウトによりレプリケーション中断…というサイクルに陥る可能性もあります。

さらに、マスターノードの単一マシンメモリの絶対量は大きすぎてはならず、ホストのメモリに占めるメモリの割合も大きすぎてはなりません。メモリの 50% ～ 65% のみを使用し、30 個を残すのが最善です。 bgsave コマンドやコピーバッファの作成などに使用するメモリの % ～ 45%。

7. 情報レプリケーション

Redis クライアントの info Replication を通じてレプリケーションに関連するステータスを表示できます。これは、マスター/スレーブノードの現在のステータスを理解し、発生する問題を解決するのに役立ちます。

マスターノード:

ノードから:

スレーブノードの場合、上部はスレーブノードとしてのステータスを示し、connectd_slaves から始まり、潜在的なマスターノードとしてのステータスを示します。

info Replication に表示される内容のほとんどは記事で説明されているため、ここでは詳しく説明しません。

7. まとめ

この記事の主な内容を確認してみましょう。

1. マスター/スレーブレプリケーションの役割: マスター/スレーブレプリケーションがどのような種類の問題 (データ冗長性、障害回復、読み取りロードバランシングなど) を解決するように設計されているかをマクロで理解します。

2. マスター/スレーブレプリケーションの操作:slaveof コマンド。

3. マスター/スレーブレプリケーションの原理: マスター/スレーブレプリケーションには、接続確立フェーズ、データ同期フェーズ、およびコマンド伝播フェーズが含まれます。データ同期フェーズには、完全レプリケーションと部分レプリケーションの 2 つのデータ同期方法があります。コマンド伝播フェーズ、マスター/スレーブノード相互のハートビートを確認するための PING および REPLCONF ACK コマンドがあります。

4. アプリケーションの問題: 読み取りと書き込みの分離 (データの不整合、データの有効期限、フェイルオーバーなど)、レプリケーションのタイムアウト、レプリケーションの中断などの問題を含み、マスター/スレーブレプリケーションに関連する構成を要約します。 repl-Timeout、client-output-buffer-limit slide などは、Redis マスター/スレーブレプリケーションの問題を解決するのに役立つ場合があります。

マスター/スレーブレプリケーションは、データの冗長性、障害回復、読み取り負荷分散などの問題を解決または軽減しますが、障害回復を自動化できない、書き込み操作の負荷分散ができない、ストレージ容量が 1 台のマシンによって制限される、などの欠点は依然として明らかです。これらの問題の解決策には、セントリーとクラスターの助けが必要です。次の記事で紹介します。注目してください。

参考文献

「Redisの開発と運用保守」

「Redisの設計と実装」

「アクション中の Redis」

http://mdba.cn/2015/03/16/redis レプリケーション中断の問題 - クエリが遅い/

https://redislabs.com/blog/top-redis-headaches-for-devops-replication-buffer/

http://mdba.cn/2015/03/17/redis マスター/スレーブレプリケーション (2)-レプリケーションバッファーとレプリケーションバックログ/

Redis の詳細な学習: マスター/スレーブ レプリケーション

序文