mmcv NCCL-Fehler mmcv/_ext.cpython-37m-x86_64-linux-gnu.so: undefiniertes Symbol, RuntimeError: NCCL-Fehler i

Fehler:

mmcv/_ext.cpython-37m-x86_64-linux-gnu.so: undefiniertes Symbol

RuntimeError: NCCL-Fehler in: /pytorch/torch/lib/c10d/ProcessGroupNCCL.cpp:38, nicht behandelter Cuda-Fehler, NCCL-Version
RuntimeError: NCCL-Fehler in: …/torch/csrc/distributed/c10d/ProcessGroupNCCL.cpp:45

Grund: Torch/Torchvision muss aktualisiert werden, und mmcv hängt stark von den beiden Versionen ab und muss entsprechend aktualisiert werden, wobei auf die Versionskorrespondenz geachtet werden muss

lösen:

pip install torch-1.8.1+cu111-cp37-cp37m-linux_x86_64.whl # 文件在官网下载 wget https://download.pytorch.org/whl/cu111/torch-1.8.1%2Bcu111-cp37-cp37m-linux_x86_64.whl
pip install torchvision-0.9.1+cu111-cp37-cp37m-linux_x86_64.whl # wget https://download.pytorch.org/whl/cu111/torchvision-0.9.1%2Bcu111-cp37-cp37m-linux_x86_64.whl
pip uninstall -y mmcv-full
pip install mmcv-full -f https://download.openmmlab.com/mmcv/dist/cu111/torch1.8.0/index.html

Referenz:
https://github.com/ultralytics/yolov5/issues/4530
https://github.com/open-mmlab/mmdetection/issues/4291

おすすめ

転載: blog.csdn.net/qxqxqzzz/article/details/128653125