[迁移学习]预训练和微调

企业开发 2023-07-02 07:49:09 阅读次数: 0

一、概述

一般的有监督迁移学习分为以下三种：

①将训练好的模型作为特征抽取模块（例如以resnet进行特征提取）

②在一个相关的任务中训练后直接后直接使用(例如gpt)

③在训练好的模型基础上进行微调

此外还有无监督学习的方式

zero-shot：没有任何标签信息

few-shot：仅能获取少量标签信息

二、微调

一般来说，神经网络可以分为两个部分：编码器(Encoder)和解码器(Decoder)。编码器的作用是将原始的像素转换为语义空间中线性可分的语义特征（特征嵌入）；解码器的作用是将编码器的语义特征映射为标号（线性分类器）。

预训练模型(Pre-trained model)：在一个较大的数据集上训练的模型（如ImageNet），该模型一般拥有较好的泛化能力。作为对比，一般从零开始训练神经网络，网络中的参数都是随机初始化，很难调优。

具体做法如下：

①构建一个新的模型，该模型的架构应该与预训练模型一致

②新模型初始化时，编码器(Encoder)直接加载预训练模型中的权重，解码器(Decoder)使用随机初始化。

③-1限制搜索空间：控制训练轮次和学习率（因为预训练模型本身就在最优解附近，需要避免偏移过多）

③-2冻结底层：底层网络一般学习到一些局部特征，而越往上层学习到的东西越是全面。具体做法是将下面几层进行冻结（学习率置0）

三、预训练模型的获取

以Pytorch为例，可以在访问此网站：Pytorch预训练模型，同时模型转换可以参考之前的文章

[PyTorch]预训练权重的转换https://blog.csdn.net/weixin_37878740/article/details/130259766 或者直接调用timm包

import timm
from torch import nn

model = timm,create_model('resnet50',pretrained=True)
model.fc = nn.Linear(model.fc.in_features,n_classes)

猜你喜欢

转载自blog.csdn.net/weixin_37878740/article/details/131150632

[迁移学习]预训练和微调

深度学习中预训练和微调的个人理解

迁移学习和微调

自然语言处理从入门到应用——预训练模型总览：迁移学习与微调

Bert模型预训练和微调

预训练模型、迁移学习

预训练网络（迁移学习）

预训练与微调的区别

一文读懂迁移学习和预训练

迁移学习、载入预训练权重和冻结权重

预训练、微调和上下文学习

预训练、微调和上下文学习（备忘）

使用本地预训练模型迁移学习

PyTorch预训练和微调：以VGG16为例

基于Pytorch框架的目标检测迁移学习和微调训练自己的数据集

微调预训练的 NLP 模型

深度学习-自然语言处理(NLP)：迁移学习（拿已经训练好的模型来使用）【GLUE数据集、预训练模型(BERT、GPT、transformer-XL、XLNet、T5)、微调、微调脚本】

深入理解预训练（pre-learning）、微调（fine-tuning）、迁移学习（transfer learning）三者的联系与区别

python深度学习--预训练网络：特征提取和模型微调（接dogs_vs_cats）

keras 模型微调与迁移训练

Tensorflow加载预训练模型和保存模型（ckpt文件）以及迁移学习finetuning

迁移学习与微调的关系

pytorch微调与迁移学习

(3)caffe学习之微调预训练的模型训练自己的数据集

NLP中的语言模型预训练&微调

CNN基础三：预训练模型的微调

使用huggingface微调预训练模型

微调预训练模型huggingface，transformers

resnet预训练模型以及微调

关于Tensorflow！目标检测预训练模型的迁移学习

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)