基于FPGA的卷积网络加速（2） - 代码天地

基于FPGA的卷积网络加速（2）

编程语言 2019-04-28 23:34:05 阅读次数: 0

分享一下是实现的CNN卷积层的一些思路，我使用的工具是xilinx的hls高级综合开发IDE，可以用高级语言c/c++来开发硬件，具体文档可看xilinx的ug902。考虑最后希望实现摄像头采集图像，FPGA加速CNN之后能够实时地输出结果（目标检测或者分类都有可能）。而摄像头是以行扫描的方式输出一幅图像，所以把输入图像数据按行存在DDR，而FPGA按行从DDR读图像。FPGA的特点之一就在于流水线处理，可以在一幅图像还没有采集完的时候就开始处理。

比如卷积核的大小为3，边缘padding填0，步长为1，则我将linebuffer的大小设置为（Height+2*padding）*Channel*3。第一次卷积需要从DDR读入两行图像，第一行需要填0。linebuffer做卷积计算，则可以输出一行输出图像（再把输出的一行图像按行输出给下一层卷积层）。

然后，第二次卷积需要把linebuffer的行往上移，并且再读入一行像素，就可以做第二次卷积。hls中c simulation的打印值，输出的RTL的仿真图如下所示。

最后的网络除了全连接层之外全部放在FPGA上，效率和资源利用率比把一幅图像或者特征图都读到FPGA上再做卷积要高不少。至于卷积的并行计算在上一篇有提到过，下次再详细有时间再详细写。

猜你喜欢

转载自blog.csdn.net/qq_38128961/article/details/89643836

基于FPGA的卷积网络加速（2）

基于FPGA的卷积网络加速设计

基于FPGA的卷积神经网络加速器_余子健

基于FPGA的GoogLeNet加速器-卷积层/汇聚层

PipeCNN论文解析：用OpenCL实现FPGA上的大型卷积网络加速

基于OpenMP加速的卷积运算

Xilinx zynq系列FPGA实现神经网络中相关资源评估 PipeCNN论文解析：用OpenCL实现FPGA上的大型卷积网络加速

【FPGA教程案例58】深度学习案例5——基于FPGA的CNN卷积神经网络之图像缓存verilog实现

【FPGA教程案例59】深度学习案例6——基于FPGA的CNN卷积神经网络之整体实现

基于FPGA的一维卷积神经网络CNN的实现（一）

基于FPGA的GoogleNet加速器-前言

Pipeline基于FPGA的CNN加速项目说明

FPGA用于数据中心的网络加速

完全基于卷积神经网络的seq2seq

卷积神经网络的压缩和加速

【FPGA教程案例60】深度学习案例7——基于FPGA的CNN卷积神经网络之testbench编写以及CNN仿真测试

基于FPGA的PCIE设计（2）

卷积神经网络-第一周作业2 (基于卷积神经网络的手势分类)

基于FPGA的GoogleNet加速器-Local Response Normalization

基于KU115的FPGA加速卡

FPGA实现神经网络加速的Hello World

基于INTEL FPGA硬浮点DSP实现卷积运算

用FPGA评估卷积神经网络快速算法

在FPGA平台上为卷积神经网络更深

03-基于Opencv/OpencL的硬件卷积加速运算

基于oneAPI中C++/SYCL的图像卷积并⾏加速

卷积神经网络-2

基于FPGA的BP神经网络

[深度学习入门案例2]基于卷积神经网络与Keras构建人脸识别模型

FPGA实现图像去雾基于暗通道先验算法纯verilog代码加速提供2套工程源码和技术支持

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)