Pytorch：模型Finetune

编程语言 2019-04-02 02:12:35 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/weixin_39393712/article/details/88954309

通常会采用一个已经训练好的模型的权值参数作为模型的初始化参数，称之为Finetune。本质上就是构建新的模型，拥有一个较好的权值初始化。

一、Finetune权值初始化

保存模型：保存一个预训练好的模型
加载模型：把预训练模型中的权值取出来
初始化模型：将权值对应的放到新模型中

step1：保存模型

net = Net()
torch.save(net.state_dict(),'net_params.pkl')

step2：加载模型

pretrained_dict = torch.load('net_params.pkl')

step3：初始化

# 创建net
net = Net() 
# 获取已创建net的state_dict
net_state_dict = net.state_dict() 
# 将pretrain_dict中 不属于net_state_dict的键剃掉：
pretrained_dict_1 = {k:v for k,v in pretrained_dict.items() if f in net_state_dict}
# 用与训练模型俄参数字典对新模型的参数字典net_state_dice进行更新
net_state_dict.update(pretrained_dict_1)
# 将更新了的参数字典放回网络
net.load_state_dict(net_state_dict)

二、不同层设置不同的学习率

采用fintune的训练过程中，有时候希望前面的学习率低一些，更新慢一些，后面的全连接层的学习率大一些，相对更新的快一些。将原始的参数组划分成多个组，每个组分别设置相应的学习率。

ignored_params = list(map(id,net.fc3.parameters()) # 返回parameters的内存地址
base_params = filter(lambda p:id(p) not in ignored_params,net.parameters())
optimizer = optim.SGD([
{'params':base_params},
{'params':net.fc3.parameters(),'lr':0.001*10}
],0.001,momentum=0.9,weight_decay= 1e-4)

以上代码的意思就是，将fc3层的参数net.fc3.parameters()从原始netparameters()中剥离出来，两层设置不同的学习率。

猜你喜欢

转载自blog.csdn.net/weixin_39393712/article/details/88954309

Pytorch：模型Finetune

Pytorch - 网络模型参数初始化与 Finetune[转]

PyTorch | 模型加载/参数初始化/Finetune

学习笔记|Pytorch使用教程28(模型finetune)

pytorch使用cnn_finetune调用预训练模型

从零学习PyTorch 第7课模型Finetune与预训练模型

24模型微调(finetune)

使用pytorch读取、使用预训练模型进行finetune：以Resnet-101为例

04_PyTorch 模型训练[Finetune 之权值初始化]

Pytorch--模型微调finetune--迁移学习（待继续学习）

生成模型finetune相关框架

Pytorch之模型微调（Finetune）——用Resnet18进行蚂蚁蜜蜂二分类为例

PyTorch参数初始化和Finetune

用pytorch实现预训练网络的finetune

finetune

用已有模型进行微调 finetune

Tensorflow 之finetune微调模型方法

LLM：finetune预训练语言模型

Pytorch的pre-train函数模型或者旧的模型的引用及修改（增减网络层，修改某层参数等） finetune微调 Pytorch的pre-train函数模型或者旧的模型的引用及修改（增减网络层，修改某层参数等） finetune微调

Pytorch下根据layers的name冻结层进行finetune训练

【PaddleOCR-det-finetune】一：基于PPOCRv3的det检测模型finetune训练

TensorFlow入门教程之6：模型微调(Finetune)

迁移学习技巧以及如何更好的finetune 模型

18.6使用官方的slim训练模型并finetune微调

大语言模型中的Finetune vs. prompt

[NLP]LLM---FineTune自己的Llama2模型

[ pytorch ] ——基本使用：(3) finetune冻结层操作 + 权重设置

0027-pytorch入门-利用resnet18 finetune进行图片二分类

以图搜图之模型篇：基于 InceptionV3 的模型 finetune

keras 预训练模型finetune,多模型ensemble，修改loss函数，调节学习率

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)