pytorch基于卷积层通道剪枝的方法

其他 2018-08-16 10:31:05 阅读次数: 0

pytorch基于卷积层通道剪枝的方法

原文：https://blog.csdn.net/yyqq7226741/article/details/78301231

本文基于文章：Pruning Convolutional Neural Networks for Resource Efficient Inference

https://arxiv.org/abs/1611.06440

下面以ResNet模型为例，讲解剪枝方法。

1 评估神经元（即通道）重要性

1.1 给模型中所有conv layer重新编号排次序；

1.2 计算每个conv layer所有通道rank值，并按通道归一化；

1.3 统计模型所有conv layer的通道数；

1.4 根据设置拟剪枝数量num（默认512），对所有convlayer通道rank值按从大到小排序，即确定rank值最小的num个通道，记录并返回它们的卷积层号和通道编号。

2 去除不重要神经元

2.1 根据拟剪枝列表（即卷积层号和通道编号），在训练好或加载的模型中去除；

2.2 如何去除，即把conv layer中按2.1中的列表，去除通道a，使a的前后通道相连，使第一卷积层输出通道数与第二层输入通道数相同，最后一个卷积层输出需与第一个全连层输入通道数相同，这里全连层不计算rank值，拟剪枝的卷积层，需要conv继承操作；

注意：残差块中需要处理公式（1）F(X)=f(x)+x中f(x)与x不同维数情况；即在convlayer通道数改变后，添加residual = out即可。这个修改虽与公式（1）本意有些出入，但通过实验发现，在模型大小减少一半的情况下，仍可以较好地与原模型精度差在1%以内；

2.3 BatchNorm层通道数修改

当所有卷积层剪枝结束，依据邻近上一个卷积层输出通道数，通过BatchNorm层继承方式，它需修改成同样的通道数即可；

3 剪枝模型训练

全网参数更新，也可设置微调特定层参数更新

4 判断剪枝是否结束，若停止到下一步微调全网参数，否则重复1---3步骤；

5微调模型

使用与训练同一个数据库，也可用另外数据库，一般来说学习率要小于训练的1到2个数量级，微调结束后保存剪枝模型。

6 问题与讨论

6.1 具体模型需定制剪枝，需依照其模型生成文件，也包括forward函数，这要在计算Loss时使用；

6.2 测试阶段

需保证剪枝模型可forward操作，设置好Variable参数，即volatile=True，以免GPU资源泄露；

具体代码参见：https://github.com/eeric/channel_prune

猜你喜欢

转载自blog.csdn.net/jacke121/article/details/81700085

pytorch基于卷积层通道剪枝的方法

基于Pytorch的卷积神经网络剪枝

【深度学习】【pytorch】对卷积层置零卷积核进行真实剪枝

模型压缩（一）通道剪枝-BN层

Pytorch之卷积层

Pytorch 卷积层

pytorch 实现卷积层

PyTorch 中的卷积层

Pytorch 卷积核填充和步幅、多输入多输出通道、池化层

基于pytorch实现模型剪枝

基于 pytorch 实现模型剪枝

【动手学习pytorch笔记】9.卷积神经网络基础（卷积层，填充和步长，多输入输出通道，池化层）

CNN卷积层里的多输入多输出通道channel 动手学深度学习v2 pytorch

PyTorch之—卷积层、激活层、BN

PyTorch: nn网络层-卷积层

实践教程｜基于 pytorch 实现模型剪枝

基于Pytorch的动态卷积复现

2.如何确定CNN的卷积核通道数和卷积输出层的通道数

pytorch-torch.nn-卷积层

pytorch代码实现之空间通道重组卷积SCConv

python实战技巧：pytorch神经网络之卷积层与全连接层参数的设置方法

python实战技巧：pytorch神经网络之卷积层与全连接层参数的设置方法

关于卷积层的输入输出通道数问题

卷积神经网络 pytorch实现（一）：卷积层

卷积神经网络轻量化教程之通道剪枝【附代码】

通道剪枝Channel Pruning

【学习笔记】Pytorch深度学习-网络层之卷积层

目标检测YOLO实战应用案例100讲-基于元学习和通道剪枝的轻量级遥感图像目标检测方法

卷积、卷积核、通道

基于PyTorch的卷积神经网络

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)