few-shot 微调网络 - 代码天地

few-shot 微调网络

企业开发 2023-10-06 01:17:35 阅读次数: 0

https://www.youtube.com/watch?v=3zSYMuDm6RU&list=PLvOO0btloRnuGl5OJM37a8c6auebn-rH2&index=3

预训练 + 微调

在大规模数据集上预训练，在support set上微调。方法简单，准确率高。

预备知识

1.1 cosine similarity

投影的长度，在-1 和1 之间。

如果长度不同，则就进行归一化。

1. softmax function

可以将一个向量，映射为一个概率分布

1. softmax classifier

是一个全连接层 + softmax函数

1. 概述

大部分的few-shot都是类似的想法，都是用一个大数据集来预训练一个神经网络，用来从图像中提取特征。做few-shot预测的时候，需要用到这个网络。

我们将query和support set中的图像，都映射为特征向量。

这样就可以比较，query和support，在特征空间上的相似度。

比例，计算两两之间的cosine similarity，最后选中相似度高的，作为query的分类结果。

预训练

用什么方法训练该网络，都可以。但是神经网络的结构和训练方法，会对结果产生影响。

对特征向量最平均，得到表征松鼠的特征向量，然后是三个特征向量做归一化，得到μ1，μ3.他们的二范数，全部为1.

μ1，μ2，μ3就是对这三个类别的表征。

分类的时候，需要拿query的特征向量，分别和μ1，μ2，μ3做对比，

有了从support中各个类别的特征向量，可以对query进行分类。

此处p为三元素向量，分别表示三个类别的概率。

Fine-tuning

Fine-turning，可以大幅提高few-shot的准确率。

假设support 有三个类别，则W为三行；p的维度也是3.

Support 中有几个或者几十个标注的样本，每个样本，都对应一个cross entropy。

用support中所有的样本和标签来学习分类器。

Support 很小，因此要加正则化。防止过拟合。

训练技巧

4.1 初始化

4.2正则化

可以用entropy来衡量概率p的信息量。

4.3 cosine similarity + softmax classifier

区别：在内积之前，先做归一化。

总结

猜你喜欢

转载自blog.csdn.net/gaotihong/article/details/124987488

few-shot 微调网络

few-shot简单的网络-siamese network

Few-Shot Learning：Siamese Network（孪生网络）

MGIMN：用于Few-shot文本分类的多粒度交互式匹配网络

（2023，网络修剪）探索 few-shot 图像生成中的不相容知识迁移

【神经网络】2021-IJCAI-从概念中学习：迈向 Few-shot Learning 的纯净记忆

元学习 & Meta Learning & Few-Shot Learning 二 || 孪生网络 (Siamese Network)

Few-Shot Learning

FEW-SHOT

浅谈few-shot

AffinityNet Semi-supervised Few-shot Learning for Disease Type Prediction——《疾病预测的半监督小样本学习_亲和网络》

[Few-shot]few-shot detection综述

few-shot learning Explanation

Few-Shot Classification Leaderboard

Few-Shot/One-Shot Learning

Zero-Shot & Few-Shot

zero-shot, one-shot和few-shot

few-shot learning是什么

Prototypical Networks for Few-shot Learning

小样本学习 few-shot learning

《Few-Shot Learning with Global Class Representations》

CVPR2019的few-shot的文章

小样本学习（Few-shot Learning）

《Few-Shot Learning with Graph Neural Networks》

＜Laplacian Regularized Few-Shot Learning＞笔记

Few-Shot Learning：基本概念

few-shot基本概念

《Prototypical Networks for Few-shot Learning》

few-shot学习笔记（自用）

(Few-shot detection)Review: Few-shot Object Detection via Feature Reweighting

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)