TensorFlow支持GPU配置问题

Tensorflow-GPU

> TensorFlow 包版本:tensorflow-gpu 1.13.1

环境条件

现有硬件

  • 电脑:华硕笔记本,FX50J

  • 显卡:NVIDIA GeForce GTX 950M

现有软件

  • Windows 10家庭中文版,x64

  • NVIDIA GPU驱动程序(对应显卡型号,版本号忘了查,但肯定低于410.x,因为在最终更新驱动之前无法使用)

  • Pyhton 3.7.0(anaconda)

硬件要求

此项内容主要参考GPU 支持 | TensorFlow

  • CUDA 计算能力为 3.5 或更高的 NVIDIA GPU卡。参阅支持 CUDA 的 GPU 卡

    在该页面查找对应自己显卡的型号即可
    比如我的显卡型号为 NVIDIA GeForce GTX 950M,则点开“CUDA-Enabled GeForce Products”栏,在右侧“GeForce Notebook Products”栏可以查到

    GPU Compute Cabability
    GeForce GTX 950M 5.0

    因此是硬件适配的

查看显卡及其驱动版本的方法推荐三种:

  1. 桌面右键点击“此电脑”-“属性”,在属性面板左侧点击“设备管理器”,打开下面的“显示适配器”条目,即可看到显卡型号,如下图。右击“NVIDIA [...]”,点击“属性”,选择“驱动程序”选项卡,即可看到驱动型号

  2. 在桌面空白处点击右键,选择“NVIDIA 控制面板”,在主页面即可看到显卡型号和驱动版本。点击“帮助”菜单,选择“系统信息”可以看到更详细的内容

  3. 下载“CPU-Z”软件,打开后选择“Graphics”选项卡,点击第一个下拉菜单栏即可看到显卡信息

软件要求

此项内容主要参考GPU 支持 | TensorFlow
注意,此项一定要按照 TensorFlow 的要求,分别查看相应软件版本是否匹配,或下载安装对应的软件版本,切勿侥幸。博主在这一项吃了大亏,浪费了很多时间
以下内容仅限于写作本文时(2019.04.21),实际要求请参见上述网页

  • NVIDIA® GPU 驱动程序 - CUDA 10.0 需要 410.x 或更高版本

  • CUDA® 工具包 - TensorFlow 支持 CUDA 10.0(TensorFlow 1.13.0 及更高版本)

  • CUDA 工具包附带的 CUPTI

    这一条博主没有注意,应该是可选或在 CUDA 中自带

  • cuDNN SDK(7.4.1 及更高版本)

    这一条主要根据 CUDA 的版本来确定cuDNN的版本

  • (可选)TensorRT 5.0,可缩短在某些模型上进行推断的延迟并提高吞吐量

    如官方文档所述,此项明确是“可选”的,故博主并未关注

步骤

0.Visual studio

  • 这一条是看其他教程提到的,因为之前安装过 VS 2017,所以没有遇到这方面的问题,也就没有关注

1.下载安装显卡驱动

  • 注意:一定要检查显卡驱动的版本,不满足要求是真的用不了……博主最后就是卡在了这个地方,灰溜溜去下了显卡型号对应的最新版本的驱动

  • 驱动下载网址为:Download Drivers | NVIDIA

  • 在网页的如下区域,选择对应的选项,搜索对应的驱动然后下载安装即可。

2.下载对应版本 CUDA

  • 注意:一定要下载安装你使用的版本 TensorFlow 支持的 CUDA 版本,比如博主用的当前最新版 tensorflow 1.13.1,则必须使用 CUDA 10.0

    建议不要使用 TensorFlow 的测试版 alpha,可能存在模块、属性的差异

  • 建议默认安装路径

  • 一开始没有注意官方文档对 CUDA版本的要求TensorFlow 支持 CUDA 10.0,以为是“支持 CUDA 10.0 及以上版本”,所以下载安装的是 CUDA 10.1,结果无法使用(抱歉没有保存报错信息)。表现为在 Python 中无法导入tensorflow

  • 此外,如果先安装了 10.1,然后安装了 10.0,一定记得卸载 10.1 相关的内容,否则会默认启动 10.1,依然报错。(其他情况以此类推)

  • 若版本不对应,可能会报错如下(错误信息来自stake overflow 某一类似问题):

ImportError: DLL load failed: The specified module could not be found.
ImportError: DLL load failed: 找不到指定模块

Failed to load the native TensorFlow runtime.

See https://www.tensorflow.org/install/install_sources#common_installation_probl ems

for some common reasons and solutions. Include the entire stack trace above this error message when asking for help.

3.安装配置 cuDNN

  1. 按照 CUDA 的版本,下载对应版本的 cuDNN

  2. 将下载的 cuDNN 解压后,其中文件分别复制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0的对应文件夹下,如(此处参考Installing Tensorflow with CUDA, cuDNN and GPU support on Windows 10 | Medium

原文件 复制到 目标文件
<安装路径> \cudnn-9.0-windows10-x64-v7.5.0.56\cuda\bin\cudnn64_7.dll -> C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0\bin <安装路径> \cudnn-9.0-windows10-x64-v7.5.0.56\cuda include\cudnn.h
  • 注意检查环境变量是否添加正确,确保已添加如下两个路径:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\libnvvp

4.安装 TensorFlow GPU 支持版本

  • 命令行运行
pip install tensorflow-gpu

即可

  • 安装 TensorFlow 的过程不再赘述

  • 祝大家安装顺利

猜你喜欢

转载自www.cnblogs.com/lierchao/p/10744227.html
今日推荐