韩松 EIE： Efficient Inference Engine on Compressed Deep Neural Network论文详解

其他 2020-04-03 21:18:33 阅读次数: 0

EIE为韩松博士在ISCA 2016上的论文，实现了压缩的稀疏神经网络的硬件加速。

与其近似方法的ESE获得了FPGA2017的最佳论文。

背景与介绍

最新的DNN模型都是运算密集型和存储密集型，难以硬件部署。

提出了EIE （Efficient Inference Engine）的方法，将压缩模型应用与硬件。

矩阵表示

这是一个稀疏矩阵相乘的过程，输入向量a，乘以矩阵W，输出矩阵为b，然后经过了ReLU。
在这里插入图片描述

用于实现相乘累加的单元称为PE，相同颜色的相乘累加在同一个PE中实现。例如上面绿色的都是PE0的责任。则PE0只需要存下来权值的位置和权值的值。所以上面绿色的权值在PE0中的存储为下面这样：

在这里插入图片描述

硬件实现

CCU（Central control unit中央控制器）用于查找非零值，广播给PE（Processing Element处理单元，可以并行的单元，也是上文中的PE）。图a为CCU，
在这里插入图片描述

b为单个 PE单元，实现将CCU广播过来的数据进行卷积的相乘累加和ReLU激活。
在这里插入图片描述

分为几部分

PE之间用H-tree结构，可以保证PE数量增加时布线长度以log函数增长（增长最缓慢的形式）

作者运用台积电TSMC的45nm的处理器。

rrr2

发布了452 篇原创文章 · 获赞 271 · 访问量 73万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/qq_35608277/article/details/104858282

韩松EIE:Efficient Inference Engine on Compressed Deep Neural Network论文详解

韩松 EIE： Efficient Inference Engine on Compressed Deep Neural Network论文详解

【读点论文】A Survey of Quantization Methods for Efficient Neural Network Inference

韩松博士毕业论文Efficient methods and hardware for deep learning论文详解

【论文阅读】韩松《Efficient Methods And Hardware For Deep Learning》节选《Deep compression》

韩松DSD:Dense-sparse-dense training for deep neural networks论文详解

【论文阅读】韩松《Efficient Methods And Hardware For Deep Learning》节选《Learning both Weights and Connections 》

Efficient Deep Neural Networks

FPGA 17最佳论文导读 ESE: Efficient Speech Recognition Engine with Compressed LSTM on FPGA

FPGA 17最佳论文 ESE: Efficient Speech Recognition Engine with Compressed LSTM on FPGA

Quantizing deep convolutional networks for efficient inference A whitepaper

论文阅读——Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference

韩松 DEEP COMPRESSION论文及代码实验

MEC：Memory-efficient Convolution for Deep Neural Network 深度神经网络中内存高效的卷积算法MEC 论文详解 ICML 2017

【模型剪枝】|Pruning Convolutional Neural Networks for Resource Efficient Inference

论文笔记-IGCV3：Interleaved Low-Rank Group Convolutions for Efficient Deep Neural Networks

论文阅读——ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks

【论文阅读笔记】ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks

ISSCC 2017论文导读 Session 14: A 28nm SoC with a 1.2GHz Prediction Sparse Deep-Neural-Network Engine

【韩松】Deep Gradient Comression

Neural Network and Deep Learning

Deep Neural Network Training

Deep Neural Network

005 Deep Neural Network

【论文阅读】ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices

《ShuffleNet: An Extremely Efficient Convolutional Neural Network for MobileDevices》论文笔记

ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks

Spiking Deep Convolutional Neural Networks for Energy-Efficient Object Recognition

Tips for Training Deep Neural Network

Paper Review: FINN: A Framework for Fast, Scalable Binarized Neural Network Inference

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)