Keras多gpu训练模型后权重文件无法在cpu或者单gpu机器使用的问题 - 代码天地

Keras多gpu训练模型后权重文件无法在cpu或者单gpu机器使用的问题

其他 2019-06-17 20:21:39 阅读次数: 0

本质：由于keras命名不一致导致的

原理：Keras版的训练它由多个输出支路，也就是多个loss，一般会给每个网络一个默认命名，在编译时通过命名寻找各层。

错误点:使用了keras.utils.training_utils.multi_gpu_model()后，名字发生了变化。因此，在预测时，keras寻找不到各层路径

由于使用了两个GPU，因此报期望两个权重信息，单只有0个

解决方法：

我们使用多GPUS训练接口，使用单GPU的保存接口

def get_model(input_shape):
.
.
.
return model
model = get_model(input_shape) #此时为单GPU 搭建的model

from keras.utils import multi_gpu_model
# Replicates `model` on 4 GPUs.
# This assumes that your machine has 4 available GPUs.
paralleled_model = multi_gpu_model(model, gpus=4) #将搭建的model复制到4个GPU中
# for train 
paralleled_model.compile(loss='categorical_crossentropy',
                       optimizer='adam')
model.save_weights("single_gpu_model.h5")
# fit data for train

tensorflow多GPUS原理：

tf将数据map到每个gpu上，分别计算loss和gradient，然后tf将所有的loss和gradient都reduce到cpu上，cpu求loss和gradient的平均后进行梯度优化

本质：多gpu加速的原理是增大batch的并行处理能力，每个GPU跑64 ，4个GPU一个Batch就跑256

猜你喜欢

转载自blog.csdn.net/weixin_38740463/article/details/91491307

Keras多gpu训练模型后权重文件无法在cpu或者单gpu机器使用的问题

Keras下使用多GPU训练模型

Keras多GPU训练以及载入权重无效的问题

keras 多GPU训练，单GPU预测

PyTorch多GPU训练模型——使用单GPU或CPU进行推理的方法

keras实现多gpu训练，单gpu保存模型，单gpu预测

keras使用GPU训练模型

keras使用多GPU并行训练模型 | keras multi gpu training

keras多gpu训练

keras使用horovod多gpu训练

使用Keras进行多GPU训练 multi_gpu_model

使用GPU 训练Tensorflow/Keras 的CNN模型

[keras] 多GPU运行设置/固定权重

Pytorch下使用多GPU训练模型

tensorflow中使用keras进行多gpu训练并进行模型保存

keras实现多GPU或指定GPU的使用

Pytorch使用GPU或者CPU训练的切换

[Keras] 使用多 gpu 并行训练并使用 ModelCheckpoint() 可能遇到的问题

使用GPU训练模型遇到的问题

keras 如何设置多GPU训练

tensorflow 1.14 keras多GPU训练

pytorch GPU训练好的模型使用CPU加载

如何利用GPU训练keras模型

keras 使用多GPU数据并行时遇到的问题

Keras学习笔记（六）——如何在 GPU 上运行 Keras?以及如何在多 GPU 上运行 Keras 模型?，Keras会不会自动使用GPU？

【tensorflow2.0】使用单GPU训练模型

pytorch cpu调用gpu训练模型

【pytorch实用小技巧】单gpu与多gpu训练与评估

把BERT模型从单GPU训练转换到多GPU训练但出现StopIteration: Caught StopIteration in replica 0 on device 0.

python&Keras实现多GPU或指定GPU的使用

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)