问题:
使用nvidia-smi命令查看显卡状态时,出现错误:
Failed to initialize NVML: Driver/library version mismatch
而使用nvcc -V查看cuda版本时,显示正常
分析解决:
从现象看是cuda正常,但与之匹配的显卡驱动版本变了,导致出现不匹配问题。
个人简单粗暴的做法是重新下载当前cuda版本的安装包,只安装驱动不安装cuda恢复正常。例如,我是cuda-12.0,下载安装:
wget https://developer.download.nvidia.com/compute/cuda/12.0.0/local_installers/cuda_12.0.0_525.60.13_linux.run
sudo sh cuda_12.0.0_525.60.13_linux.run
安装后执行nvidia-smi,正常显示显卡状态。