torch加载与训练模型并对新模型进行初始化 - 代码天地

torch加载与训练模型并对新模型进行初始化

其他 2020-10-03 18:37:03 阅读次数: 0

https://blog.csdn.net/Jee_King/article/details/86423274

主要是根据这个博文进行操作，其中由于有些层无法更名所以利用pop把这些层从预训练模型中进行删除。

print('loading pretrained origin_model from {0}'.format("trained_model/mixed_second_finetune_acc97p7.pth"))
# 导入已经训练好的crnn模型
origin_model = torch.load("trained_model/mixed_second_finetune_acc97p7.pth")

# 打印模型信息
# for i in origin_model:
#     print(i, origin_model[i].size())

# 删除不相同的层
origin_model.pop('rnn.1.embedding.weight')
origin_model.pop('rnn.1.embedding.bias')

# 打印更新后模型信息
for i in origin_model:
    print(i, origin_model[i].size())

# 创建新模型并获取新字典
model = re_crnn.CRNN(32, 1, new_nclass, 256)
model_dict = model.state_dict()

# 打印新模型字典
# for i in model_dict:
#     print(i, model_dict[i].size())

# 初始化权重
new_state_dict = {k:v for k,v in origin_model.items() if k in model_dict}

model_dict.update(new_state_dict)
model.load_state_dict(model_dict)

# 打印权重信息观察
# for name, para in origin_model.named_parameters():
#     print(name, torch.max(para))
# for name, para in model.named_parameters():
#     print(name, torch.max(para))

猜你喜欢

转载自blog.csdn.net/wi162yyxq/article/details/100079032

torch加载与训练模型并对新模型进行初始化

AllenNLP实践——参数初始化与加载预训练模型

【pytorch 修改预训练模型：实测加载预训练模型与模型随机初始化差别不大】

Pytroch进行模型权重初始化

用MXnet预训练模型初始化Pytorch模型

Pytorch模型训练--模型初始化（2）

Pytorch 快速入门（七）加载预训练模型初始化网络参数

PyTorch | 模型加载/参数初始化/Finetune

thinphp 模型初始化

模型权重初始化

【BUG】tensorflow预训练简单模型及权重文件复用初始化复杂模型

vpp初始化 --- 线程初始化及线程模型

torch模型加载数据

torch保存加载模型

初始化你的pytorch模型

NN模型设置--参数初始化

【DeepCV】模型参数的初始化方式

flex 初始化模型问题

【colab pytorch】模型权重初始化

模型参数的延后初始化

【pytorch】模型参数的访问与初始化

模型权重初始化代码

Pytroch 模型权重初始化

04_PyTorch 模型训练[Finetune 之权值初始化]

初始化加载

pytorch如何使用torchtext初始化LSTM的embedding层？如何用各种预训练模型初始化embedding层？

torch 模型加载和保存模型

PyTorch中使用预训练的模型初始化网络的一部分参数

torch 默认使用 Xavier 初始化

torch 默认的初始化方法

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)