Tensorflow学习笔记6：解决tensorflow训练过程中GPU未调用问题 - 代码天地

Tensorflow学习笔记6：解决tensorflow训练过程中GPU未调用问题

其他 2019-07-24 17:04:51 阅读次数: 0

1、发现问题

目前模型训练一次需要11秒左右，怀疑GPU没有成功调用

查看GPU是否成功调用，nvidia-smi，nvidia-smi 命令解读

发现没有相关GPU的进程在跑，GPU没有被调用，什么问题？需要去查找下原因，首先想到的是我们的tensorflow版本是否是GPU版本的。

2、查看tensorflow版本

参考：确定自己的TensorFlow是CPU还是GPU的版本

显示默认调用的是CPU，然后tensorflow版本为1.7.0，在查阅的时候发现调用GPU还和cuda 和 cudnn有关

先来查看下我们的cuda版本

版本为8.0，看看是否和我们的tensorflow版本有冲突，参考：TensorFlow GPU 版本总结

显示1.5版本以上，需cuda 9.0版本，而我们的tensorflow版本为1.7，理论上是需要cuda 9.0以上的版本，现在有两个思路:

1、升级cuda版本；

2、降级tensorflow版本。

网上初略查了下，升级cuda可能遇到的问题会比较多，下面我们采用第2种思路

3、降级tensorflow版本到1.4

pip install tensorflow-gpu==1.4.0

测试跑的是GPU还是CPU

import numpy

import tensorflow as tf

a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')

b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')

c = tf.matmul(a, b)

sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))

print(sess.run(c))

之后就会出现详细的信息：

然后设置train.py里面的文件，不同模块找不同模块的train.py文件，在object_detection模块修改一下内容：

修改为False即可，在运行模块，可以发现速度快了很多

服务器终端输入：nvidia-smi，发现已经有相关GPU的进程在跑

扫描二维码关注公众号，回复： 6857404 查看本文章

猜你喜欢

转载自www.cnblogs.com/zheng1076/p/11239085.html

Tensorflow学习笔记6：解决tensorflow训练过程中GPU未调用问题

tensorflow在训练过程中逐步减少学习率

深度学习训练过程中的问题&解决

tensorflow训练过程中内存溢出

Tensorflow训练过程中查看某参数的值

tensorflow-SSD算法在训练过程中出现的问题和解决方案

TensorFlow之tf.nn.dropout()：防止模型训练过程中的过拟合问题

解决Caffe训练过程中loss不变问题

在tensorflow分布式训练过程中突然终止（终止）

TensorFlow学习笔记（四）：Tensorflow网络构建和TensorBoard进行训练过程可视化

全网最详细win10+anaconda+GPU+Tensorflow Object Detection API训练自己数据+新手教程+训练过程问题解决

总结使用Tensorflow训练数据的过程中遇到的问题！

tensorflow笔记：模型的保存与训练过程可视化

Tensorflow 3. 训练过程，出现loss=NAN的问题？

解决：pytorch-ssd在训练过程中遇到的一系列问题

训练过程中的一些问题

训练过程中，出现样本错误的问题

【yolox训练过程中遇到的问题集合】

机器学习训练过程中的模型攻击的类型

TensorFlow编译过程中遇到的问题及解决方案

tensorflow训练过程的日志与监控

Tensorflow 保存和载入训练过程

Tensorflow——可视化训练过程

在学习tensorflow过程中遇到的问题

tensorflow-python学习过程中遇到的问题

使用tensorflow下的GPU加速神经网络训练过程

YOLOv5训练过程中验证集不加载标签问题的解决方法

训练过程--GPU训练

深度学习：模型训练过程中Trying to backward through the graph a second time解决方案

模型训练过程中，混合精度训练稳定性解决方案

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)