MultiCUDA:一台机器上的多个版本的 CUDA

我为一个经常从事机器学习工作的研究部门管理服务器环境,这意味着我必须维护 GPU 服务器的配置。问题在于,不同的研究人员根据不同版本的 TensorFlow 和 CUDA 有不同的程序或模型。然而,没有简单的方法可以安装多个版本并使其正常工作。

解决这个问题的一种方法是使用 Docker 为各种必要的配置创建自定义环境。如果可以的话,这可能是您想要的方式,但遗憾的是我们的用户还不太熟悉 Docker,所以我在这里深入研究 Linux 手册和环境变量,试图找到一种让它工作的方法。

好消息是有办法。一旦您知道如何操作,它也不是特别复杂,但它有点挑剔。

我使用的示例是在当前配置为运行 CUDA 10.0 的 Ubuntu 16.04 计算机上安装 CUDA 8.0,以便可以使用依赖于 CUDA 8.0 的 TensorFlow 1.4。其他 Linux 发行版和 CUDA 版本的原理应该是相同的。

我知道的唯一依赖项是安装了支持 CUDA 版本的 NVIDIA 驱动程序版本。兼容性图表可以在https://docs.nvidia.com/deploy/cuda-compatibility/index.html找到,并且在编写时最新驱动程序向后兼容 CUDA 7.0。

注意:默认情况下,不同版本的Ubuntu支持不同版本的CUDA。在 16.04 上,支持 CUDA 8.0 至 10.2,而 Ubuntu 18.04 上仅支持 CUDA 10.0 至 10.2。我认为其他操作系统也有类似的情况。

1. 安装所需的 CUDA 工具包版本

$ sudo apt-get install cuda-toolkit-8-0

安装多个版本不会导致任何以前的版本被覆盖,因此无需担心。您安装的每个版本都会覆盖导致操作系统使用特定版本的配置,但默认情况下它们都按版本号安装在单

猜你喜欢

转载自blog.csdn.net/iCloudEnd/article/details/132270099