Pytorch从指定epoch恢复训练 - 代码天地

Pytorch从指定epoch恢复训练

企业开发 2023-06-25 13:16:23 阅读次数: 0

1、在训练时保存每个epoch的模型&optimizer&epoch

checkpoint= {'model': model.state_dict(), 'optimizer': optimizer.state_dict(), 'epoch': epoch}

torch.save(checkpoint, path)

2、从指定epoch恢复

path_checkpoint = "./models/checkpoint/ckpt_best_1.pth" # 断点路径

checkpoint = torch.load(path_checkpoint) # 加载断点

model.load_state_dict(checkpoint['net']) # 加载模型可学习参数

optimizer.load_state_dict(checkpoint['optimizer']) # 加载优化器参数

start_epoch = checkpoint['epoch'] # 设置开始的epoch

注意：lr_scheduler是根据内置的index进行更新的，外界的epoch对其并不会产生影响，因此要自己设置lr_scheduler的last_epoch；如果恢复时optimizer的param_groups(list of dicts)没有initial_lr，也要自己设置initial_lr（可以在训练时也保存下来每个epoch的lr），否则会报错，例如

optimizer = optim.AdamW([{'params': model.parameters(), 'initial_lr': config.lr}], lr=config.lr)

scheduler = optim.lr_scheduler.MultiStepLR(optimizer, milestones=[50, 120], gamma=0.5, last_epoch=config.iter)

参考：

pytorch 从指定epoch恢复训练 - 简书 (jianshu.com)

坑中坑之Pytorch断点重新训练/恢复训练scheduler设置/last_epoch研究_pytorch恢复训练_Mr.July的博客-CSDN博客

猜你喜欢

转载自blog.csdn.net/qq_41021141/article/details/131208156

Pytorch从指定epoch恢复训练

pytorch使用指定GPU训练

pytorch训练时指定显卡

在PyTorch训练一个epoch时，模型不能接着训练，Dataloader卡死

pytorch：预训练权重、冻结训练和断点恢复

pytorch载入预训练模型后，训练指定层

Pytorch学习系列之十：如何确定合适的epoch数、在加载的模型基础上继续训练

【Pytorch踩坑记录】深度学习程序在训练第x个Epoch的过程中直接被退出终端

Pytorch：lr_schedule恢复训练的注意事项

恢复 Substrate 链: unexpected epoch changes

tensorflow从已经训练好的模型中，恢复(指定)权重

【环境配置】Pytorch指定使用GPU编号训练数据

pytorch固定部分参数进行网络指定层训练

网络训练至某个epoch，参数问题

epoch

tesnorflow实现N个epoch训练数据读取的办法

神经网络训练中-Epoch、Batch Size和迭代

将训练中每个epoch的参数写入log日志

tensorflow从已经训练好的模型中，恢复(指定)权重(构建新变量、网络)并继续训练(finetuning)

【人工智能概论】 PyTorch固定部分参数实现对指定层参数的训练与遇到的问题

Pytorch模型保存&恢复

Pytorch - GPU ID 指定 pytorch gpu 指定

【pytorch】随着epoch增加，显存逐渐增加？解决pytorch显存释放问题

训练模型的保存与恢复

PyTorch指定GPU

[转] pytorch指定GPU

pytorch使用指定的GPU

【pytorch】训练集的读取

PyTorch预训练

pytorch训练error

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)