模型轻量化方法之----神经网络稀疏

其他 2020-03-30 10:32:07 阅读次数: 0

1 稀疏

本人尝试过的稀疏算法有限，目前尝试过阈值稀疏、admm稀疏方式和简易pattern pruning，在此做一小结。

日后若有别的这方面尝试，会继续加。
稀疏的好处：减少存储，减少运算量，软硬件都可用。

网络层数多，结构复杂，往往有更多的冗余
不同场景下需求不一样。大数据集训练，小数据集测试可以带来更高的稀疏度
本身参数值就小，可能更容易有更高的稀疏度
针对不同网络层，采用不同的稀疏度

1.1 结构化稀疏

1） layer pruning

直接将某一层全部置零

2） channel pruning

某些通道全为零

3） intra-kernel pruning

某些行（列）全为零

pattern pruning

预先设置一些pattern作为mask,
针对weight的每个通道，选择与各pattern相乘之后，绝对值和最大的那个pattern
训练

1.2 非结构化稀疏

1）阈值稀疏

简言之，就是将绝对值小的值置为零。

这里细分还可以分为按层（per-layer）和按通道（per-channel）

随机初始化再稀疏有时候比pretrain后稀疏效果好，特别是稀疏度较高的情况下

2） admm稀疏

将稀疏问题，转化为了优化问题，使用admm方法解之，得到凸优化解法，具体看paper。
在这里插入图片描述

分三步：

第一步：得到pretrain模型

第二步admm_prune: 修改loss函数，加上正则化项，引入Z，U
在这里插入图片描述

更新W，b

在这里插入图片描述

更新Z
在这里插入图片描述
更新U

不断更新Z, U ，直到W 趋向于 Z或者正则化项收敛(Z趋于W稀疏后的结果， W趋于Z)

第三步retrain : 对W小的值置零，且对应位置保持为零，不再更新

调参：稀疏度，学习率，net_loss和admm_loss的比例

吃饱喝足开始干活

发布了21 篇原创文章 · 获赞 17 · 访问量 3703

私信关注

猜你喜欢

转载自blog.csdn.net/qq_33892106/article/details/96476003

模型轻量化方法之----神经网络稀疏

轻量化神经网络综述

轻量化卷积神经网络

【神经网络】神经网络加速之量化模型

轻量化神经网络模型总结：SqueezeNet、Xception、MobileNet、ShuffleNet

【论文总结】轻量化神经网络模型总结：SqueezeNet、Xception、MobileNet、ShuffleNet

神经网络轻量化改进之CNN架构设计

轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络SqueezeNet，MobileNet，ShuffleNet

轻量化卷积神经网络（SqueezeNet，MobileNet，ShuffleNet，Xception）

神经网络推理加速之模型量化

深度神经网络模型量化

改进YOLOv8：替换轻量化骨干网络Efficient V1、Efficient V2《重新思考卷积神经网络的模型缩放》）

轻量化卷积神经网络MobileNet论文详解（V1&V2）

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

ShuffleNetV1:极致轻量化卷积神经网络(分组卷积+通道重排)

ShuffleNetV2:设计轻量化卷积神经网络的理论准则和应用实现

卷积神经网络轻量化教程之通道剪枝【附代码】

量化神经网络

神经网络的量化

微软提出自动化神经网络训练剪枝框架OTO，一站式获得高性能轻量化模型

超全总结：神经网络加速之量化模型 | 附带代码

YOLOX改进之模型轻量化（Lite）

神经网络模型二值量化综述2020

神经网络（模型）量化介绍 - PTQ 和 QAT

【神经网络】(11) 轻量化网络MobileNetV1代码复现、解析，附Tensorflow完整代码

神经网络量化实践

【神经网络学习笔记】卷积神经网络之搭建卷积神经网络模型

神经网络基础之Python与向量化

YOLOv8改进实战 | 更换主干网络Backbone之轻量化模型Efficientvit

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)