怎么理解预训练模型？

企业开发 2023-04-08 03:44:54 阅读次数: 0

预训练模型的理解

什么是预训练
预训练的思想
CV领域的预训练

什么是预训练

“预训练“的做法一般是将大量低成本收集的训练数据放在一起，经过某种预训方法去学习其中的共性，然后将其中的共性“移植”到特定任务的模型中，再使用相关特定领域的少量标注数据进行“微调”，这样的话，模型只需要从”共性“出发，去“学习”该特定任务的“特殊”部分即可。

预训练的思想

预训练的思想是：模型的参数不再是随机初始化的，而是通过一些任务进行预先训练，得到一套模型参数，然后用这套参数对模型进行初始化，再进行训练

CV领域的预训练

首先对于CV领域图片分类任务，常用的深度学习模型是卷积视神经网络，对于多层的卷积神经网络来说，不同的层学到的特征是不同的，为了捕获更多的特征，浅层的感受野较小，所以浅层学到的特征往往是更加通用的，包含更多的像素点的信息，比如一些细粒度的信息：颜色、纹理、边缘等。
通常在大规模图片数据上预先获得‘通用特征’，然后再去做下游任务：
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_51756104/article/details/127180594

怎么理解预训练模型？

预训练网络模型

预训练模型MASS

预训练模型

预训练模型ERNIE

什么是预训练模型？

预训练模型（X）---- 预训练模型现状及分析

caffe | 预训练模型的使用

tensorflow调用预训练模型

pytorch调用预训练模型

pytorch 预训练模型修改

加载resNet预训练模型

NLP预训练语言模型

各种框架的预训练模型

keras加载预训练模型

Tensorflow预训练模型地址

bert 预训练模型路径

预训练模型的应用（pytorch）

预训练语言模型（一）

预训练模型（3）---- XLNet

预训练模型（7）---- ELECTRA

预训练模型（6）---- MASS

笔记nlp预训练模型

pytorch加载预训练模型

预训练语言模型综述

Detectron 预训练模型下载

预训练模型分类体系

tensorflow预训练模型及代码

nlp 预训练模型总结

预训练模型、迁移学习

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)