知识蒸馏（Distillation）相关论文阅读（2）——Cross Model Distillation for Supervision Transfer - 代码天地

知识蒸馏（Distillation）相关论文阅读（2）——Cross Model Distillation for Supervision Transfer

其他 2018-09-23 21:27:25 阅读次数: 0

知识蒸馏相关论文目录导读：

——————————————————————————————————————————

《Cross Model Distillation for Supervision Transfer》

Saurabh Gupta

先放一个论文里网络的图片：

此论文的成果：完成了一个由ImageNet上网络对从有监督学习到无监督学习的学习迁移，同时可以完成训练网络到测试网络的模型压缩（可以由VGG-VGG，也可以由VGG-AlexNet）。

需要注意的训练细节：

数据集：NYUD2，由paired images组成一对一对的数据集。对Teacher网络使用RGB-D图片，具有深度信息以及instance级别的标签分类；对Student网络使用Paired Depth Image，只具有深度信息。
两个function：（1）transformation funtion t：对于Teacher和Student网络结构不同时，从中间取出的网络层channel和size可能会出现不同的情况，需要从Student到Teacher做映射，完成feature map的channle、size匹配。（2）loss function f：t函数映射后，loss function为大网络的Feature map与小网络的Feature map的L2 instance。
loss层选择：中间层蒸馏效果更好，论文选在pool5后。
网络选择：VGG——AlexNet，AlexNet——AlexNet：fine-tuning（only train fc parameters）

猜你喜欢

转载自blog.csdn.net/Lucifer_zzq/article/details/79718906

知识蒸馏（Distillation）相关论文阅读（2）——Cross Model Distillation for Supervision Transfer

Model Distillation with Knowledge Transfer in Face Classification, Alignment and Verification

Preparing Lessons: Improve Knowledge Distillation with Better Supervision论文笔记

知识蒸馏（Knowledge Distillation）

知识蒸馏Knowledge Distillation

MODEL COMPRESSION VIA DISTILLATION AND QUANTIZATION 论文笔记

Private Model Compression via Knowledge Distillation 论文笔记

知识蒸馏（Knowledge distillation）必读论文合集

知识蒸馏（Distillation）相关论文阅读（1）——Distilling the Knowledge in a Neural Network（以及代码复现）

知识蒸馏（Distillation）相关论文阅读（3）—— FitNets : Hints for Thin Deep Nets

Knowledge Distillation 知识蒸馏详解

Knowledge Distillation(KD) 知识蒸馏

【知识蒸馏】Masked Generative Distillation

知识蒸馏简介（Knowledge Distillation）

Contrastive Model Inversion for Data-Free Knowledge Distillation

Lion:Adversarial Distillation of Closed-Source Large Language Model

【论文解读】One Teacher is Enough? Pre-trained Language Model Distillation from Multiple Teachers

Knowledge Distillation(KD) 知识蒸馏 Pytorch实现

知识蒸馏是什么？（Knowledge Distillation）KD

【知识蒸馏】Knowledge Distillation with the Reused Teacher Classifier

知识蒸馏综述 Knowledge Distillation: A Survey

【知识蒸馏】 Knowledge Distillation from A Stronger Teacher

概念解析 | 知识蒸馏(Knowledge Distillation)

扩散模型相关论文阅读，扩散模型和知识蒸馏的结合提升预测速度：Progressive Distillation for Fast Sampling of Diffusion Models

【知识蒸馏】知识蒸馏（Knowledge Distillation）技术详解

Knowledge Distillation 知识蒸馏之 Hint layer & self-knowledge distillation

知识蒸馏—原理+代码实战(Distillation CNN 和 Progressive Distillation Diffusion)

Residual Knowledge Distillation论文精度

论文解读：Decoupled Knowledge Distillation

知识蒸馏（Knowledge Distillation）的Pytorch实现以及分析

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)