Pytorch在加载的模型基础上继续训练 - 代码天地

Pytorch在加载的模型基础上继续训练

编程语言 2023-04-10 06:50:05 阅读次数: 0

深度学习网络模型的训练往往会花费挺长时间，这时候万一断电了，机器死机了，那真的气不打一处来，想砸机器的冲动都来了有没有？

不过也不用太着急，一般咱们的模型都写有模型参数保存功能，比如这样：

if epoch%10 == 1:
	torch.save(model.state_dict(),'{}/moilenetV2_{}_{}.pth.format('./models',epoch,acc))

我们只需要找到这个模型保存的位置，然后把最新的这个模型参数加载到我们的model中，就可以接着这个参数进行训练了。要加载的代码一般放在model定义之后（就是确定model的结构了），模型进行训练之前。要加载代码如下：

Resume = True
# Resume = False
if Resume:
	path_checkpoint = 'your/new/model/path.pth'
	checkpoint = torch.load(path_checkpoint, map_location = torch.device('cpu'))
	model.load_state_dict(checkpoint)

变量Resume可以作为开关，如果想在训练好的模型基础上进行finetune（微调）的话，就把它设置为True，从零训练的话就设置为False。当然咱们这种出问题，接着训练的就设置为True就行。

知识扩充

训练模型的保存包括两种：
1、保存整个模型框架以及模型参数（存储文件过大，不推荐）

torch.save(model,path)

2、仅仅保存模型的参数文件（推荐）

torch.save(model.state_dict(),path)

"state_dict"表示state dictionary，即字典类型的参数，模型本身的参数。

其中torch.load()函数可以加载模型参数，为了保证GPU显存够用，推荐令map_location = torch.device(‘cpu’)

假如你就想加载到gpu中，可以令map_location = torch.device(‘cuda’)

最后用model.load_state_dict(checkpoint)把参数加载完成。

好了，快去训练你的模型吧！有问题欢迎留言~

猜你喜欢

转载自blog.csdn.net/WYKB_Mr_Q/article/details/118546342

Pytorch在加载的模型基础上继续训练

Pytorch学习系列之十：如何确定合适的epoch数、在加载的模型基础上继续训练

pytorch保存与加载模型来测试或继续训练

yolov3如何在之前训练的基础上继续训练

加载训练的模型参数并继续训练

pytorch加载预训练模型

Pytorch预训练模型加载

pytorch训练模型保存与加载

pytorch在cpu上加载预先训练好的GPU模型以及GPU上加载CPU上训练的Model

如何加载训练完毕后的模型文件继续训练模型

cpu上训练的模型放到gpu上继续训练

Pytorch模型训练--模型保存与加载（3）

android 基础上拉刷新和下拉加载

【caffe】caffe 在已有模型上继续训练模型

pytorch模型的训练、保存和加载

pytorch 如何加载部分预训练模型

PyTorch如何加载预训练模型

PyTorch加载预训练模型(pretrained)

pytorch加载预训练模型参数的方式

Pytorch 加载训练好的模型遇到的error

pytorch 中模型的保存与加载，增量训练

pytorch加载预训练模型部分参数

pytorch多GPU训练模型保存及加载

预训练模型的加载机理pytorch版

使用django 加载pytorch训练好的模型

引力模型基础上的工具变量如何构建？

slice基础上

Linux基础上

Pytorch模型训练之-- Pytorch数据集加载

tensorflow模型继续训练？？

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)