预训练(pre-training/trained)与微调(fine-tuning) - 代码天地

预训练(pre-training/trained)与微调(fine-tuning)

其他 2020-06-20 18:31:32 阅读次数: 0

什么是预训练和微调？

预训练(pre-training/trained)：你需要搭建一个网络来完成一个特定的图像分类的任务。首先，你需要随机初始化参数，然后开始训练网络，不断调整直到网络的损失越来越小。在训练的过程中，一开始初始化的参数会不断变化。当你觉得结果很满意的时候，就可以将训练模型的参数保存下来，以便训练好的模型可以在下次执行类似任务时获得较好的结果。这个过程就是pre-training。

之后，你又接收到一个类似的图像分类的任务。这个时候，你可以直接使用之前保存下来的模型的参数来作为这一任务的初始化参数，然后在训练的过程中，依据结果不断进行一些修改。这时候，你使用的就是一个pre-trained模型，而过程就是fine-tuning。

所以，预训练就是指预先训练的一个模型或者指预先训练模型的过程；微调就是指将预训练过的模型作用于自己的数据集，并参数适应自己数据集的过程。

微调的作用

在CNN领域中。很少人自己从头训练一个CNN网络。主要原因上自己很小的概率会拥有足够大的数据集，从头训练，很容易造成过拟合。

所以，一般的操作都是在一个大型的数据集上训练一个模型，然后使用该模型作为类似任务的初始化或者特征提取器。比如VGG，Inception等模型都提供了自己的训练参数，以便人们可以拿来微调。这样既节省了时间和计算资源，又能很快的达到较好的效果。

参考：https://blog.csdn.net/abc13526222160/article/details/89320108?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase

猜你喜欢

转载自www.cnblogs.com/zhibei/p/13169798.html

预训练(pre-training/trained)与微调(fine-tuning)

fine-tuning:预训练中的迁移

深入理解预训练（pre-learning）、微调（fine-tuning）、迁移学习（transfer learning）三者的联系与区别

预训练大语言模型的三种微调技术总结：fine-tuning、parameter-efficient fine-tuning和prompt-tuning

预训练+微调+Rethinking ImageNet Pre-training论文阅读笔记

模型微调fine-tuning

fine-tuning（微调）的理解

Keras 的预训练权值模型用来进行预测、特征提取和微调（fine-tuning）

caffe 预训练或者Fine-Tuning 操作

预训练网络实战之fine-tuning

Caffe fine-tuning 微调网络

LLMs指令微调 Instruction fine-tuning

Rethinking ImageNet Pre-training 重新审视Imagenet预训练

LLMs领域适应的预训练Pre-training for domain adaptation

【Pytorch】在修改后的网络结构上加载Pre-trained模型以及Fine-tuning

如何使用OpenAI fine-tuning(微调)训练属于自己专有的ChatGPT模型？

【Keras】使用预训练的模型进行图像分类fine-tuning

【20】迁移学习与微调（fine-tuning）方法

OpenAI 双语文档参考 Fine-tuning 微调

翻译: 迁移学习和微调 Transfer learning & fine-tuning

轻量化微调 Parameter-Efficient Fine-Tuning

LLMs对单个任务进行微调Fine-tuning on a single task

基于ChatYuan-large-v2 语言模型 Fine-tuning 微调训练广告生成任务

深层网络的贪婪逐层预训练方法（greedy layer-wise pre-training）

LLM预训练大型语言模型Pre-training large language models

Fine-tuning

什么是fine-tuning？

fine-tuning介绍

ChatGPT进阶：利用Fine-tuning训练自己的模型

LLM-大模型训练-步骤(二)-预训练/Pre-Training(2)：重参数式预训练(Part-Param Pre-Training)【Lora/ptuning...】【中文无监督学习语料】

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)