[Tucao] [mellanox] RoCE はデフォルトで有効になっています

コネクタ 5、このネットワーク カードに対応する OFED ドライバに対応する設定は、デフォルトで RoCE 機能を開始することです。これにより、いくつかの問題が発生します。この機能が仮想マシンで必要ない場合、メモリの無駄が発生し、1 つの UDP ポートの可用性が失われます。同時に、別の問題は、RoCE 機能を無効にしたい場合は、ホスト
https://enterprise-support.nvidia.com/s/article/HowTo-Enable-Disable-RoCE-で設定する必要があることです。 VM 経由 VFs-ConnectX-4 以降;
https://mellanox.my.site.com/mellanoxcommunity/s/article/How-to-Disable-RoCE

無効化機能を仮想マシン層から設定できないのは設計が悪いです。RoCE を使用する必要がある製品もあれば、使用する必要のない製品もあり、これらの VF はすべて共有されるため、共有の問題が発生する可能性があります。

この Roce が無効になっている場合、ログに次のログが記録されます:
May 15 02:29:18 -b kernel: [ 3.056048] ib_srpt MAD register failed for mlx5_0-1.
May 15 02:29:18 -b kernel: [ 3.058822] ib_srpt srpt_add_one(mlx5_0) が失敗しました。

試してみるもう 1 つのステップ

Enable_roce: RoCE 有効化状態
RoCE 有効化状態は、RoCE トラフィックに対するドライバーのサポートを制御します。
RoCE が無効な場合、gid テーブルは存在せず、生のイーサネット QP のみがサポートされ、既知の UDP RoCE ポート上のトラフィックがサポートされます。

おすすめ

転載: blog.csdn.net/qq_36428903/article/details/130692818