如何利用预训练模型进行模型微调（如冻结某些层，不同层设置不同学习率等） - 代码天地

如何利用预训练模型进行模型微调（如冻结某些层，不同层设置不同学习率等）

其他 2020-04-11 02:14:23 阅读次数: 0

由于预训练模型权重和我们要训练的数据集存在一定的差异，且需要训练的数据集有大有小，所以进行模型微调、设置不同学习率就变得比较重要，下面主要分四种情况进行讨论，错误之处或者不足之处还请大佬们指正。
（1）待训练数据集较小，与预训练模型数据集相似度较高时。例如待训练数据集中数据存在于预训练模型中时，不需要重新训练模型，只需要修改最后一层输出层即可。
（2）待训练数据集较小，与预训练模型数据集相似度较小时。可以冻结模型的前k层，重新模型的后n-k层。冻结模型的前k层，用于弥补数据集较小的问题。
（3）待训练数据集较大，与预训练模型数据集相似度较大时。采用预训练模型会非常有效，保持模型结构不变和初始权重不变，对模型重新训练
（4）待训练数据集较大，与预训练模型数据集相似度较小时。采用预训练模型不会有太大的效果，可以使用预训练模型或者不使用预训练模型，然后进行重新训练。

Al小卒

发布了36 篇原创文章 · 获赞 1 · 访问量 6384

私信关注

猜你喜欢

转载自blog.csdn.net/qq_34291583/article/details/105328711

如何利用预训练模型进行模型微调（如冻结某些层，不同层设置不同学习率等）

如何为模型不同层设置不同的学习率？

不同层设置不同学习率

pytorch加载预训练模型、微调、以及现有模型中加入自己的层、为不同层设置不同的参数更新

【Pytorch】模型不同层设置不同的学习率

小白编程用Pytorch导入预训练模型&&设置不同学习速率

tensorflow小技巧之不同模型参数设置不同学习率

预训练中固定模型中某些层后训练，这些层还是变动了？

对比不同学习率对模型结果的影响

TCP模型不同层的协议

不同预训练模型的总结对比

微调预训练的 NLP 模型

在PyTorch里面利用transformers的Trainer微调预训练大模型

Pytorch对预训练好的VGG16模型进行微调

Keras中如何使用预训练的模型进行特征提取或微调--以图片分类为例

TensorFlow进行不同模型和数据集之间的迁移学习和模型微调

【tensorflow】在不同层上设置不同的学习率，fine-tuning

pytorch 冻结层操作 + 学习率超参数设置

修改torch 预训练的某些层的参数

[深度学习 - 技巧] 通过修改预训练模型权重层修改模型输出

pytorch载入预训练模型后，训练指定层

pytorch学习率设置——optimizer.param_groups、对不同层设置学习率、动态调整学习率

pytorch 加载使用预训练模型和 fine tune 模型微调(冻结一部分层)实战

深度学习实战(二) 模型重用及冻结层

NLP中的语言模型预训练&微调

CNN基础三：预训练模型的微调

Bert模型预训练和微调

使用huggingface微调预训练模型

微调预训练模型huggingface，transformers

resnet预训练模型以及微调

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)