性能の悪いデュアル SIM TITAN サーバーを使用したところ、Paddle から警告が表示されました。一般的な意味は、デュアル SIM ではなくパンチ カードのみを使用でき、NCCL2 をインストールする必要があるということです。
以下の簡単な翻訳は、NCCL の公式文書のみです。
https://docs.nvidia.com/deeplearning/nccl/install-guide/index.html
1. コードライブラリをインストールする
Ubuntu に NCCL をインストールするには、まず NCCL パッケージを含む APT システムにリポジトリを追加し、次に APT を通じて NCCL パッケージをインストールする必要があります。ローカル リポジトリとネットワーク リポジトリの 2 つのリポジトリが利用可能です。新しいバージョンがリリースされたときにアップグレードを簡単に取得できるように、後者を選択することをお勧めします。
ローカル倉庫にインストールする場合は、ここからダウンロードして、対応するバージョンを見つける必要があります。
https://developer.nvidia.com/nccl/nccl-download
ネットワークインストール方法:
<architecture>
CPU アーキテクチャに置き換えてください:x86_64
、ppc64le
、またはsbsa
<distro>
ubuntu1604
、、、ubuntu1804
など、実際のシステムのバージョンに置き換えてくださいubuntu2004
。
wget https://developer.download.nvidia.com/compute/cuda/repos/<distro>/<architecture>/cuda-keyring_1.0-1_all.deb
sudo dpkg -i cuda-keyring_1.0-1_all.deb
2. apt データベースを更新する
sudo apt update
3. apt インストール nccl2
APT を使用してlibnccl2
パッケージをインストールします。NCCL
さらに、パッケージを使用してアプリケーションをコンパイルする必要がある場合は、libnccl-dev
パッケージをインストールすることもできます。
sudo apt install libnccl2 libnccl-dev
もちろん、次のようにバージョンを指定することもできます。
sudo apt install libnccl2=2.4.8-1+cuda10.0 libnccl-dev=2.4.8-1+cuda10.0