网络压缩-1、低秩分解 - 代码天地

网络压缩-1、低秩分解

其他 2019-02-27 02:51:19 阅读次数: 0

网络压缩(network compression)
1、低秩近似（低秩分解 Low Rank Expansion）

上图展示了低秩分解的基本思想:
将原来大的权重矩阵分解成多个小的矩阵，
右边的小矩阵的计算量都比原来大矩阵的计算量要小，
这是低秩分解的基本出发点。

奇异值分解SVD、CP分解、Tucker分解、Tensor Train分解和Block Term分解用低秩矩阵近似原有权重矩阵。
例如，可以用SVD得到原矩阵的最优低秩近似，或用Toeplitz矩阵配合Krylov分解近似原矩阵。
SVD分解：
全连接层的权重矩阵记作 W∈Rm×n ,首先对 W 进行 SVD 分解，如下：

W=USV转置
为了能够用两个较小的矩阵来表示 W ，我们可以取奇异值的前 K 个分量。
于是，W可以通过下式重建：

W^=U^S^V^T,其中U^∈Rm×kV^∈Rn×k
我们唯一需要保存的就是3个比较小的矩阵 U,S,V ,我们可以简单算一下压缩比为 mn/k(m+n+1)
矩阵的秩概念上就是线性独立的纵列（或者横列）的最大数目。行秩和列秩在线性代数中可以证明是相等的，例如：
3*3的矩阵如下，则行秩 == 列秩 == 秩 ==3
1 2 3
4 5 6
7 8 9
1*3的矩阵如下，则 行秩== 列址 == 秩 ==1
[1 2 3] 
3*1的矩阵如下，则 行秩== 列址 == 秩 ==1
[1] [2] [3] 
 低秩分解，这个名字虽然唬人， 实际上就是把较大的卷积核分解为两个级联的行卷积核和列卷积核。 常见的就是一个3*3的卷积层，替换为一个3*1的卷积层加上一个1*3的卷积核。 容易计算得，
一个特征图1010，经过33卷积核后得到88的特征图输出，而替换为低秩后，则先得到108的特征图然后再得到8*8的特征图。

另外现在越来越多网络中采用1×1的卷积，而这种小的卷积使用矩阵分解的方法很难实现网络加速和压缩。

a、奇异值分解svd
b、Tucker分解解决SVD分解中输入的通道S大的问题
c、CP分解加速神经网络的方法
d、块分解
LBCNN 局部二值卷积卷积稀疏滤波器

猜你喜欢

转载自blog.csdn.net/J_Boom/article/details/87932650

网络压缩-1、低秩分解

模型压缩中的低秩分解

低秩分解

奇异值分解 SVD 红外小目标图像压缩 Matlab 低秩性分析

压缩感知与低秩矩阵恢复求解

机器学习——低秩矩阵分解中低秩的意义、矩阵填补、交叉验证

LEP+低秩+神经网络去噪

Machine Learning第九讲【推荐系统】-- （三）低秩矩阵分解

Compact Multi-Head Self-Attention 低秩因子分解

低秩逼近证明

图像低秩

矩阵的满秩分解

使用ADMM结合压缩感知算法估计低秩稀疏矩阵的详细MATLAB实现解析

斯坦福大学机器学习笔记——推荐系统（协同过滤、低秩分解、推荐系统）

矩阵满秩分解证明

高等工程数学 —— 第三章（1）三角分解和满秩分解

矩阵的分解：满秩分解和奇异值分解

2020-基于多网络特征和双网络正交低秩学习的乳腺癌图像分类（IEEE Access）

健指算法（二）模拟网络连通检查（按秩归并&路径压缩）

[吴恩达机器学习笔记]16推荐系统5-6协同过滤算法/低秩矩阵分解/均值归一化

Lora模型【大型语言模型的低秩适应】【LoRA提议冻结预训练模型的权重，并在每个Transformer块中注入可训练层（称为秩分解矩阵）。这大大减少了可训练参数的数量和GPU内存需求】

7.4.1 矩阵低秩近似、矩阵范数

图像的低秩表达与LoRA技术

并查集：按秩归并&路径压缩

四、矩阵分解---三角分解Doolittle、满秩分解

低秩矩阵(矩阵填充)-图像修复、协同过滤

低秩恢复算法（图像去噪）

低秩矩阵填充|奇异值阈值算法

低秩稀疏矩阵恢复|ADM(IALM)算法

LoRA:大模型的低秩自适应微调模型

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

第五讲：AbstractBean以及Ioc常见注解使用和自动装配

python-re模块学习-正则表达式

黑客攻击常用手段

正则表达式的规则

windwos::mutex

Spring中日志的使用（log4j）

Bootstra5 按钮处理

JVM内存结构-这一篇全部了解

Android的低级错误

Oracle中Cursor, A表a1字段值复制到B表b1字段

每日归档

更多

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)