[深度学习 - 技巧] 通过修改预训练模型权重层修改模型输出 - 代码天地

[深度学习 - 技巧] 通过修改预训练模型权重层修改模型输出

其他 2021-03-06 06:29:54 阅读次数: 0

前阵子做了个以图搜图特征编码模型啊。（详情看上一篇）
但是由于图库数据较大（上亿数据），所以2048维的特征编码存储量太大，一个特征8KB，用户并发起来服务器也够呛，而且java那边相似度计算也慢。

由于图库里面的图形都比较简单，老大觉得512够用了，要我修改网络输出到512维的特征编码。

但是模型网络那边提供的预训练模型，Resnet50只有输出层是2048维的。我们也不想换Resnet18（可能会较大的降低精度）。

因此我只能够再Resnet50的预训练权重包上面下手。

1. 修改网络结构

首先，我先看我的网络结构。（在这个位置：cirtorch/networks/imageretrievalnet.py）

根据我的网络初始化设置，我用的预训练包是Resnet50_w，也就是再Resnet50后面加了一层全连接网络。输出1 * 2048的特征编码。(如果可视化的看网络结构可以用https://netron.app 如下图所示。)
resnet50_2048
因此我只要修改全连接层的输入输出就行，输入保持不变2048（因为Resnet最后一层输出是 2048），输出改为512。

    if whitening:
        whiten = nn.Linear(2048, dim, bias=True)
    # 这里再上面设置了dim = 512

修改完我们的网络结构后，我们就要用这个网络加载权重，可是我们的权重包就跟上图一样，最后一层搭配不上。那我们需要怎么加载网络呢。

2. 修改模型权重

如下图所示，我们希望我们的模型权重最后一层长这样。
resnet50_512
那就好办了。只需要再加载模型后，将weights的第一维砍掉3/4，同样bias也砍掉3/4。就可以完成加载权重了。如下代码。

temp_state = torch.load('weights/resnet50_dim2048.pth.tar')
temp_state['state_dict']['whiten.weight'] = temp_state['state_dict']['whiten.weight'][0::4, ::]
temp_state['state_dict']['whiten.bias'] = temp_state['state_dict']['whiten.bias'][0::4]

修改完后，要记得用新的预训练模型重新进行训练。

猜你喜欢

转载自blog.csdn.net/weixin_41809530/article/details/109547013

[深度学习 - 技巧] 通过修改预训练模型权重层修改模型输出

深度学习模型的技巧

深度学习训练技巧

Keras深度学习模型训练技巧

入门 | 深度学习模型的简单优化技巧

构建深度学习模型的基本技巧

深度学习提升模型表现的技巧

深度学习_GAN_GAN模型训练的优化技巧

AL遮天传 DL-深度学习模型的训练技巧

PyTorch深度学习实战——模型训练实用技巧

【Pytorch学习笔记】12.修改预训练模型权重参数的方法（用于对单通道灰度图使用预训练模型）

深度学习训练技巧必读（转载）

深度学习网络的训练技巧

分割学习训练技巧模型

【深度学习总结】【深度学习-2018-年度总结】【计算机视觉】【预训练模型库】【神经网络技巧】【高性能计算】【人工智能】

深度检测模型比赛训练技巧（Tricks）

[译]深度学习模型的简单优化技巧，作者：Jonathan Balaban

4个提高深度学习模型性能的技巧

深度学习技巧应用21-ShuffleNet模型中的点卷积和通道混洗的运用技巧，模型的训练与测试

深度学习技巧应用9-模型训练中学习率的调整和假数据生成技巧与总结

深度学习技巧应用6-神经网络中模型冻结-迁移学习技巧

深度学习技巧应用23-利用latex对深度学习各种网络模型的图像进行绘制

[深度学习 - 技巧] tensorboard实时查看损失和权重的变化

深度学习技巧应用11-模型训练中稀疏化参数与稀疏损失函数的应用

[深度学习]让你的PyTorch模型更快地训练的一些技巧

深度学习技巧与窍门

深度学习基础与技巧

PyTorch 深度学习的技巧

2019.5.8深度学习技巧

深度学习技巧

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)