tensorflow/keras 模型搭建以及第一个epoch速度极慢的问题

企业开发 2023-04-07 06:15:06 阅读次数: 0

解决keras在模型搭建部分，以及第一个epoch速度极慢的问题

问题描述
问题分析
解决方案
附录：tensorflow-cuda-cudnn对应表

问题描述

使用GPU版本的keras搭建深度学习模型时，在模型顺序构造部分【从Sequential()到add()】会卡住一段时间；而在模型开始训练时，会在第一个epoch卡住相对很长的时间之后才能开始训练。

问题分析

在搜索引擎上查找，有不少人提出过相关问题，但是没有找到一个较好的解决方案。折腾了一会儿之后，猜测是 tensorflow / keras 版本的问题。经实践，在conda下创建了一个python3.9的环境，并用conda安装相关包后可以流畅运行（tensorflow2.5版本）。在此基础上继续查找资料，最终认为本质上是cuda和cudnn的问题。conda默认安装的cuda和cudnn版本是跟随环境中的python版本，这就造成了它们与显卡驱动的不匹配，然后出现了上述的情况。在测试环境下，3.9的python版本使得conda在安装tensorflow-gpu的情况下选择了新版本的cuda和cudnn库，使得模型能正常构建与训练。
简而言之，这个问题一般是由cuda和cudnn的版本落后于显卡驱动造成的。例如，30系列的显卡，它们只支持cuda11、cudnn8以上的版本，使用旧版本就会出现这样的问题。

解决方案

请根据自身显卡型号和驱动版本，选择合适的cuda和cudnn，然后再此基础上在选择 tensorflow / keras 的版本。尤其在使用conda之类包管理工具时，不要无脑conda install package，确认完依赖库版本之后，再指定版本，进行包管理。

附录：tensorflow-cuda-cudnn对应表

tensorflow版本与python/cuda/cudnn版本对应关系表中内容来源：https://www.tensorflow.org/install/source_windows#gpu

猜你喜欢

转载自blog.csdn.net/weixin_43331420/article/details/119758039

tensorflow/keras 模型搭建以及第一个epoch速度极慢的问题

Tensorflow keras 回归模型

Keras tensorflow Resnet模型

Java调用Keras、Tensorflow模型

tensorflow简介以及与Keras的关系

Tensorflow, Keras, Python环境搭建

Tensorflow Serving部署tensorflow、keras模型详解

tensorflow和keras的版本问题

tensorflow 与keras 混用导致的问题

Sklearn，TensorFlow，keras模型保存与读取

使用GPU 训练Tensorflow/Keras 的CNN模型

TensorFlow-Keras预训练模型测试

keras（tensorflow后端）给模型建立单独的graph

Tensorflow2.0 Keras之模型装配

pytorch, tensorflow, keras统计模型参数大小

python3.8搭建Keras +TensorFlow环境

使用Python，Keras和TensorFlow训练第一个CNN

tensorflow与keras版本不匹配问题

Python使用keras和tensorflow遇到的问题

python安装keras和tensorflow问题

tensorflow、keras、numpy的版本兼容问题

Problem after converting keras model into Tensorflow pb - 将keras模型转换为Tensorflow pb后的问题

【问题】【KERAS】【Tensorflow】关于tensorflow中的梯度为None的问题

TensorFlow 安装遇到的问题 AttributeError: module 'tensorflow' has no attribute 'keras'

tensorflow2.0学习——tensorflow-keras 归一化

TensorFlow和keras的前世今生以及keras和tf.keras的对比

CNN & Python实现（tensorflow构建一个CNN、Keras）

keras模型导出到tensorflow，以及pb模型导出

【Keras】Linux一个shell脚本安装python、keras、tensorflow、anaconda等~

Tensorflow2 Keras模块-快速搭建模型

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)