TensorFlow - GPU显存很高而利用率Volatile GPU-Util很低 - 代码天地

TensorFlow - GPU显存很高而利用率Volatile GPU-Util很低

其他 2020-01-12 12:30:34 阅读次数: 0

TensorFlow学习- GPU显存占满而利用率（util）很低原因&提高方法_m0_38064529的博客-CSDN博客
https://blog.csdn.net/m0_38064529/article/details/103168172

参考1：
TensorFlow如何提高GPU训练效率和利用率
分析显卡利用率低的原因是每个训练过程中有些进程是在CPU中执行的，像load下个batch、预处理batch、打印日志、后处理等，并且有的任务cpu和GPU是交替执行的，进一步降低了GPU利用率。
提出了四个方式提高利用率：
1、把代码都用tf的API重写；
2、使用Estimator把大部分代码写进计算图
3、使用th.data预处理数据集，并用tf.records存储
4、用prefetch、parallel mapping使样本并行处理，不让gpu闲着

由于是新手具体的操作过程哈没看懂，详细直接看原文。

参考2：
实验中GPU利用率低的可能的原因：
作者进行试验分析出来是日志的问题，把关于权重和偏差值记录的代码注释掉之后利用率提高了。原因和上一篇差不多。

参考3：
GPU Memory Usage占满而GPU-Util却为0的调试
作者的CPU全满，GPU却是0
通过阅读官方文档分析出原因是 GPU不能计算 float64，算的话就很慢
然后根据文档建议，使用config和warn_float64帮助找到float64的输入；之后试图设定一个cast_policy参数，自动把numpy产生的数组转换成float32失败；最后检查所有numpy调用，全部手动制定dtype=numpy.float32，执行一下某个命令，成功!

batch size太小，导致模型的并行化程度太低。还有你的cpu、内存/显存带宽性能不足。

https://ask.csdn.net/questions/752324

训练效率低？GPU利用率上不去？快来看看别人家的tricks吧～ - 知乎（推荐）
https://zhuanlan.zhihu.com/p/53345706

站内首发文章

如果曾经拥有

发布了18 篇原创文章 · 获赞 5 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/Zhou_Dao/article/details/103696942

TensorFlow - GPU显存很高而利用率Volatile GPU-Util很低

gpu 显存占用与 volatile gpu-util （gpu利用率）

出现显存占用率很高，但是GPU利用率为0%的情况

linux显存与gpu利用率都很低

深度学习PyTorch，TensorFlow中GPU利用率较低，CPU利用率很低，且模型训练速度很慢的问题总结与分析

深度学习之GPU显存与利用率浅析小结

深度学习PyTorch中GPU利用率较低，CPU利用率很低

GPU利用率忽高忽低

pytorch high memory usage but low volatile gpu-util

keras 提高 GPU利用率

GPU利用率低的原因

动态查看GPU利用率

mmlab提高GPU利用率

Tensorflow占用GPU显存问题

GPU利用率（使用率）计算公式

tensorflow设置gpu及gpu显存使用

【已证实】训练神经网络时，GPU利用率低而显存占用率高的思考

关于GPU显存占满（即memory usage 很大），但GPU-util很小，导致模型训练很慢

38、Tensorflow：tensorflow中使用指定的GPU及GPU显存

实验中GPU利用率低的可能的原因：

机器学习如何提高GPU利用率

【优化调参】提升GPU和CPU的利用率

GPU 利用率低常见原因分析及优化

【NVIDIA】获取GPU利用率-cpp.md

TensorFlow指定GPU设备、分配显存

Tensorflow指定GPU的指定和显存设置

TensorFlow gpu设置和显存设置

（转）tensorflow中使用指定的GPU及GPU显存

windows10下pytorch的GPU利用率低，占用率低

tensorflow显存管理、tensorflow使用多个gpu训练

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)