免責事項:この記事はブロガーオリジナル記事です、続くBY-SAのCC 4.0を著作権契約、複製、元のソースのリンクと、この文を添付してください。
します。https://community.mellanox.com/s/article/understanding-subnet-manager-sm-high-availability-ha-on-mellanox-infiniband-switches公式サイトのリンクを参照してください。
一、Mellanox社SM HAソリューション(メラノックスのInfiniBandスイッチ)
- メラノックスIBスイッチにSM HA(設定の同期)を有効にする場合、SMデータベースはSMで有効すべてのスイッチと同期されます。
- イーサネット管理ネットワークを使用したアウトオブバンド同期が行われます。SM HAに参加するすべてのスイッチは、ルータを経由することなく、同じ管理サブネット(同一ネットワーク)に接続する必要があります。スイッチは通常、ルーターを横断しないマルチキャスト制御フレームを送信するためです。
- Mellanox社SM HAに参加するすべてのスイッチは、インフィニバンド・サブネットIDに接合されています。入社後は、同期のSMが起動されています。ノードの一つがSMマスターとして選択され、他はスレーブです。
- SM HAは、システムマネージャが入力し、仮想IP(VIP)を使用して、単一の場所から別のサブネット・マネージャのすべてのInfiniBand SMの設定を変更することを可能にします。すべてのサブネットマネージャは、制御開始、またはこのVIPアドレスから停止することができます。ユーザーは、SMコンフィギュレーションのためのVIPアドレスを使用することが期待されています。IPが無効になりますマスターまたはスレーブ上のSMパラメータを設定しようとしています。
第二に、実験環境
IBスイッチ | IP |
---|---|
SF6036-01 | 172.16.0.251 |
SF6036-02 | 172.16.0.252 |
第三に、コンフィギュレーション
1、クラスタVIPを設定
SF6036-01 [standalone: master] > enable
SF6036-01 [standalone: master] # config terminal
SF6036-01 [standalone: master] (config) # ib ha cluster ip 172.16.0.253 255.255.240.0
SF6036-01 [cluster: master] (config) #
図2に示すように、第二のスイッチ・クラスタを追加します
SF6036-02 [standalone: master] (config) # ib ha cluster
SF6036-02 [cluster: standby] (config) #
3、散開星団
SF6036-01 [cluster: master] (config) # ib smnode SF6036-01 enable
SF6036-01 [cluster: master] (config) # ib smnode SF6036-02 enable
4、(0-15)の優先順位を設定します
SF6036-01 [cluster: master] (config) # ib smnode SF6036-01 sm-priority 1
SF6036-01 [cluster: master] (config) # ib smnode SF6036-02 sm-priority 2
第四に、クラスタをチェックします
パワーワンIBスイッチを遮断し、テストすることができ、マスターがシフトすると、事業運営に影響を与えません。
1、IBの可用性ステータスを参照してください
SF6036-01 [cluster: master] (config) # show ib ha
Global HA state
==================
IB Subnet HA name: cluster
HA IP address: 172.16.0.253/20
Active HA nodes: 2
HA node local information
Name: SF6036-01 (active) <--- (local node)
SM-HA state: master
IP: 172.16.0.251
Virtual switch membership: infiniband-default
HA node local information
Name: SF6036-02 (active)
SM-HA state: standby
IP: 172.16.0.252
Virtual switch membership: infiniband-default
SF6036-01 [cluster: master] (config) # show ib ha brief
Global HA state
==================
IB Subnet HA name: cluster
HA IP address: 172.16.0.253/20
Active HA nodes: 2
ID SM-HA state IP Virtual switch membership
--------------------------------------------------------------------------------
*SF6036-01 master 172.16.0.251 infiniband-default
SF6036-02 standby 172.16.0.252 infiniband-default
2は、IB SMの状態を表示します
SF6036-01 [cluster: master] (config) # show ib smnodes
HA state of switch infiniband-default
========================================
IB Subnet HA name: cluster
HA IP address: 172.16.0.253/20
Active HA nodes: 2
HA node local information
Name: SF6036-01 (active) <--- (local node)
SM-HA state: master
SM Licensed: yes
SM Running: running
SM Enabled: enabled - master
SM Priority: 1
IP: 172.16.0.251
HA node local information
Name: SF6036-02 (active)
SM-HA state: standby
SM Licensed: yes
SM Running: running
SM Enabled: enabled
SM Priority: 2
IP: 172.16.0.252
3、接続状況を確認
この時点では、172.16.0.253(VIP)を介して接続することができます!!!