1. 报错提示
docker 使用GPU 资源时(–gpus all)出现如下报错:
Error response from daemon: could not select device driver with capabilities: [[gpu]]
2.分析
nvidia-container-toolkit 缺少的问题造成(在docker 19.03版本后,可以不需要安装nvidia-docker依赖就可以在docker 中使用GPU资源)
3.解决
安装nvidia-container-toolkit
sudo apt-get install -y nvidia-container-toolkit
如果报错无法安装,显示
E: Unable to locate package nvidia-container-toolkit
则需要添加nvidia-docker源,可参考这个链接(https://blog.csdn.net/weixin_44994838/article/details/124409068)
安装好 nvidia-container-toolkit依赖后,重启docker:
sudo systemctl restart docker
然后就可以在docker容器中正常使用GPU资源