如何调用GPU训练模型【详细教程2】——PyTorch的安装及配置

目录

PyTorch安装

安装时踩的坑

提升安装速度的方法

检验安装结果


PyTorch安装

上篇文章安装了CUDA和cuDNN,还没有安装的可以参考:如何调用GPU训练模型【详细教程1】——CUDA和cuDNN的安装https://blog.csdn.net/weixin_45206129/article/details/130319783?spm=1001.2014.3001.5501

至此,进行最后一步,PyTorch的安装,还记得最开始打开的Pytorch网站吗:PyTorch 

选择刚才安装的CUDA版本(11.8),对应的安装命令如下:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
or
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

该安装指令要在Anaconda的虚拟环境下运行,以上两个指令皆可,可能会失败,多试几次,失败了就换一个。


安装时踩的坑

重点来了!我在尝试安装cuda11.8的PyTorch时,无论使用conda还是pip,都按照不成功,提示找不到对应版本的资源,且各种镜像和官方源都不可,后来换成cuda11.7成功,(个人猜测应该是官方库的cuda11.8丢失了)

以下为cuda11.7的安装指令:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
or
conda install pytorch torchvision torchaudio pytorch-cuda=11.7 -c pytorch -c nvidia

安装11.7cuda的Pytorch后,将CUDA降级(重新安装11.7版本,再次拷入cuDNN)。


提升安装速度的方法

在这里再分享另一个安装方法,我是使用pip安装的,虽然能与官方库联通,但是下载速度很捉急(20kb/s),可以分析一下上述的安装指令:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

  1.  pip3 install:安装指令的意思
  2. torch torchvision torchaudio:分别为要安装的三个包
  3. --index-url https://download.pytorch.org/whl/cu117:寻找安装包的路径

可以看出,我们安装完整的pytorch,要安装三个包【torch、torchvision、torchaudio】

因此我们可以打开命令行页面,每次单独执行一个包的安装,例如:

pip3 install torch --index-url https://download.pytorch.org/whl/cu117

如果正常联通,开始下载,会显示下载包的完整名字, 但是下载速度很慢,这时将包名记录下来,将进程结束掉,去到上面的--index-url后面的网站,找到对应包,手动下载,速度会快很多。

手动下载好后,放到一个自己能找到的目录,打开anaconda prompt,激活虚拟环境,cd进入到存放包的盘符,cd进入目录,使用pip install xxxxxxxx.whl进行安装,这里要替换为你的包名。

于我个人经验来说,三个包只有torch的安装比较慢,因为比较大, 可以手动下载安装;其余两个用pip指令直接安装即可。安装完成后,pip list可以看到如下三个包(torchcrf不是此次安装的):


检验安装结果

三个包都安装好,没有问题后,可以进行一下检验,检验主要是两方面:

(1)PyTorch是否可以被引用        (2)是否可以调用显卡进行计算

首先来检测PyTorch是否可以被引用,在Python Console输入import torch并回车,如果不报错,即为正常引用:

之后再分别输入print(torch.__version__)print(torch.cuda.is_available())来查看Pytorch版本,以及是否可以调用GPU:

可以看到分别显示 1.13.1+cu117 和 True,代表版本是1.13.1,且是cuda11.7版本的,如果是cpu版本这里会不显示cu117而是cpu;True代表GPU可以被调用,如果是False,可能是因为CUDA安装不正常或是PyTorch没有下载正确,逐层逆推回去查找原因。我把代码贴在下方,方便大家复制

import torch

print(torch.__version__)

print(torch.cuda.is_available())

 至此CUDA+cuDNN以及PyTorch的安装已经全部结束,理论上可以进行模型训练,之后我会再发一篇如何通过修改代码来调用GPU进行训练

希望能对你有所帮助!

猜你喜欢

转载自blog.csdn.net/weixin_45206129/article/details/130330944