知识蒸馏（深度学习模型压缩） - 代码天地

知识蒸馏（深度学习模型压缩）

企业开发 2023-06-05 07:05:15 阅读次数: 0

模型压缩大体上可以分为 5 种：

模型剪枝：即移除对结果作用较小的组件，如减少 head 的数量和去除作用较少的层，共享参数等，ALBERT属于这种；
量化：比如将float32 降到 float8；
知识蒸馏：将 teacher 的能力蒸馏到 student上，一般 student 会比teacher 小。我们可以把一个大而深的网络蒸馏到一个小的网络，也可以把集成的网络蒸馏到一个小的网络上。
参数共享：通过共享参数，达到减少网络参数的目的，如 ALBERT 共享了 Transformer 层；
参数矩阵近似：通过矩阵的低秩分解或其他方法达到降低矩阵参数的目的；

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_41318914/article/details/127720154

知识蒸馏（深度学习模型压缩）

【模型压缩】（四）——知识蒸馏

【轻量化深度学习】知识蒸馏与NLP语言模型的结合

bert模型压缩系列——知识蒸馏（一）

深度学习 | 训练网络trick——知识蒸馏

深度学习实践篇[17]：模型压缩技术、模型蒸馏算法：Patient-KD、DistilBERT、DynaBERT、TinyBERT

神经网络模型压缩和加速之知识蒸馏

一文弄懂模型知识蒸馏、剪枝、压缩、量化

深度学习-模型压缩

【模型压缩】蒸馏算法小结

模型压缩-裁剪、量化、蒸馏

学习笔记12/8 知识蒸馏深度学习 softmax

深度学习方法（十五）：知识蒸馏（Distilling the Knowledge in a Neural Network），在线蒸馏

知识蒸馏学习记录

知识蒸馏---学习笔记

深度学习论文详解：目标检测(从OverFeat到YOLO .v4)、人脸识别（从FaceNet到ArcFace）和模型压缩(蒸馏方法和亮点)

深度学习模型压缩与加速

深度学习模型压缩压缩方法

【模型压缩- 剪枝/量化/蒸馏/AutoML】

模型蒸馏与压缩简单介绍

模型压缩- 剪枝/量化/蒸馏/AutoML

深度学习：蒸馏和剪枝

卷积网络压缩中的知识蒸馏综述

深度学习_模型压缩及移动端部署_模型压缩及移动端部署基础知识（持续更新）

知识蒸馏DEiT算法实战：使用RegNet蒸馏DEiT模型

知识蒸馏入门视频学习

知识蒸馏学习记录（二）

【学习】网络压缩：知识蒸馏、参数量化、动态计算，PPO

【学习】深度强化学习、模型压缩

（等待填坑）深度学习——蒸馏loss、蒸馏学习

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)