【模型压缩】Deep Compression，多种方式混合经典paper - 代码天地

【模型压缩】Deep Compression，多种方式混合经典paper

其他 2020-03-02 19:07:01 阅读次数: 0

Paper：Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding

论文链接：https://arxiv.org/abs/1510.00149

ICLR 2016的best paper，通过剪枝、量化、哈夫曼编码三步混合来做模型压缩。

Introduction

整个算法流程主要为上图三部分：

1.剪枝：将部分很小的权值设为0，使权值矩阵转为一个稀疏矩阵。

2.量化：将剪枝后保留的权值进行量化，使剪枝后保留的权值共享使用的值，这样可以减小保存权值使用的空间，进一步压缩所需要的存储空间。

3.哈夫曼编码：霍夫曼编码是一种编码形式，进一步减小数据保存需要的存储空间。

Pruning

CSR将原始矩阵分为三部分，AA，JA，IC
将原始n×n大小的稀疏矩阵用2a+n+1个数值表示。

作者在CSR和CSC的基础上，将index上的值由绝对坐标转为偏移量表示，减少了存储

剪枝的实现过程：

1.设定一个阈值，绝对值大于这个阈值的权值被保留，其他权值被置0。
2.使用存储稀疏矩阵的压缩存储方式存储剪枝过后的权值矩阵（例如CSR、CSC）。

Quantization

流程：

量化的实现:

1.初始化k-means质心：k-means质心的初值对结果的影响很大，有三种方法：均匀量化，随机量化和按密度量化，作者证明使用均匀量化的初始化效果较好。

2.确定量化阈值：确定对于每一个权值使用哪个量化输出来代替。

3.进行微调：对k-means的质心再进行微调。

对k-means的质心进行微调:

由于剪枝的作用，矩阵已经成为稀疏矩阵，权值矩阵中为0表示该连接被移除，因此这些位置的梯度被舍弃。

n是权重的数量，b是原始的每个权值的比特数，k为量化簇的数量

量化:
完成量化后，原来的稀疏矩阵变为一个稀疏矩阵加一个查找表，达到了压缩的目的。

Huffman Coding

该图显示了压缩前和压缩后的长度分布

Experiment

Deep Compression能够在不损失精确度的情况下把参数压缩到35到49倍。

发布了49 篇原创文章 · 获赞 41 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/DL_wly/article/details/99058255

【模型压缩】Deep Compression，多种方式混合经典paper

模型压缩：Deep Compression

模型压缩deep compression

模型压缩之deep compression

Deep Compression/Acceleration（模型压缩加速总结）

模型压缩：Deep Compression/Acceleration（汇总）

模型压缩 | Deep Compression论文理解及Caffe源码修改（2）

模型压缩 | Deep Compression论文理解及Caffe源码修改（1）

模型压缩（Model compression）

【深度神经网络压缩】Deep Compression （ICLR2016 Best Paper）

深度神经网络压缩 Deep Compression （ICLR2016 Best Paper）

Deep Learning（深度学习）之（六）【深度神经网络压缩】Deep Compression （ICLR2016 Best Paper）

【深度神经网络压缩】 Deep Learning（深度学习）之（六）【深度神经网络压缩】Deep Compression （ICLR2016 Best Paper）

Deep Generative Video Compression(NIPS 2019) - Video Compression Paper Reading

paper | Semantic Perceptual Image Compression using Deep Convolution Networks(2017)

深度网络模型压缩 - CNN Compression

DVC: An End-to-end Deep Video Compression Framework(CVPR 2019) - Video Compression Paper Reading

Deep Compression：使用剪枝算法、权重量化和霍夫曼编码的的深度神经网络压缩

深度神经网络压缩与加速综述 Deep Neural Network Compression and Acceleration: A Review

深度学习模型压缩与优化加速（Model Compression and Acceleration Overview）

模型压缩方向一个很牛的paper

模型加速--CLIP-Q: Deep Network Compression Learning by In-Parallel Pruning-Quantization

Paper | Deep Mutual Learning

Gate Decorator: Global Filter Pruning Method for Accelerating Deep Convolutional Neural Networks - 模型压缩 - 2 - 代码学习

卷积神经网络CNN经典模型整理Lenet，Alexnet，Googlenet，VGG，Deep Residual Learning

卷积神经网络CNN经典模型Lenet，Alexnet，Googlenet，VGG，Deep Residual Learning

经典CTR预估模型：LR, FM, FFM, Wide&Deep, DeepFM, DSSE 算法对比总结

深度学习模型压缩与优化加速综述（Model Compression and Acceleration Overview）

Android 图片压缩之多种压缩方式结合使用

Hadoop文件压缩Compression

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)