Student Helping Teacher: Teacher Evolution via Self-Knowledge Distillation论文解读

其他 2023-04-08 08:33:04 阅读次数: 0

前言

许久没写博客，今天趁着假期最后一天，分享下今天看到的一篇关于自蒸馏的论文。

题目：Student Helping Teacher: Teacher Evolution via Self-Knowledge Distillation
地址：https://arxiv.org/abs/2110.00329
github：https://github.com/zhengli427/TESKD/

主要思路

之前的蒸馏方法基本都是teacher监督student或者多个student之间互相监督，BYOT论文中，作者将student拆分为多个block，每个block都单独接一个fc，计算celoss，相当于希望每个block都可以学到更加鲁棒的feature（当然，浅层的feature最终的分类效果肯定是相对比较差的）。

在TESKD，也就是这篇博客的主角中，作者借鉴了BYOT以及FPN的结构，使得模型训练以一种自蒸馏的方式呈现出现，不同层级之间的feature也会进行融合并互相监督，融合之后的feature也会接avgpool以及fc，最终也是具有分类能力的，融合的这个过程进一步提升了feature的鲁棒性，也带来了更为优秀的分类结果

结构框图

下面是TESKD自蒸馏算法的结构框图，这其中其实只有一个网络，也就是我们最终用于部署的网络，但是这里为了区分，还是将其称之为教师网络，T1~T4是区分出来的4个block，这对于ResNet等比较标准的网络来说都是比较好实现的（不同的Res sta

猜你喜欢

转载自blog.csdn.net/u012526003/article/details/120641921

Student Helping Teacher: Teacher Evolution via Self-Knowledge Distillation论文解读

Knowledge Distillation and Student-Teacher Learning for Visual Intelligence

Knowledge Distillation & Student-Teacher Learning for Visual Intelligence: A Review & New Outlooks

论文讲解：Knowledge distillation: A good teacher is patient and consistent

【知识蒸馏】Knowledge Distillation with the Reused Teacher Classifier

【知识蒸馏】 Knowledge Distillation from A Stronger Teacher

teacher-student 网络架构

深度学习基础--不同网络种类--teacher-student网络,蒸馏(distillation)网络

MySQL --Student、Course、Teacher、Score SQL查询

Student_Teacher_Course_Score_SQL题

深度学习论文: Student-Teacher Feature Pyramid Matching for Anomaly Detection及其PyTorch实现

【论文解读】One Teacher is Enough? Pre-trained Language Model Distillation from Multiple Teachers

Be Your Own Teacher 论文阅读

Self-Knowledge Distillation: A Simple Way for Better Generalization论文阅读

从Student类和Teacher类多重派生Graduate类

多老师知识蒸馏模型——Anomaly detection based on multi-teacher knowledge distillation

【半监督学习】1、Mean Teacher | 对 student model 权重进行 EMA 来加速更新 teacher model

C++课后题——(C++Teacher类和Student类)定义一个Teacher(教师)类和一个 Student( 学生)类

sql 复杂查询以teacher student course多对多关系为例

1480: 多重继承派生（4）--person、student、teacher和graduate类

Java面试题-数据库多表联查,student,course,sc,teacher

Date、Person、Student 、Teacher完成多态和非多态的代码编写

Java基础编程题目——编写Teacher类和Student类继承Person类

从Student类和Teacher类多重派生Graduate类代码参考

根据学习曲线斜率的绝对值自动课程学习：Teacher–Student Curriculum Learning

用无限套娃的extends做一个teacher and student案例

[半监督学习] Teacher-Student Learning Paradigm for Tri-training

Knowledge Distillation 知识蒸馏之 Hint layer & self-knowledge distillation

distill_basic_teacher

Harry And Math Teacher

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)