固定点分解网络Fixed-point Factorized Networks - 代码天地

固定点分解网络Fixed-point Factorized Networks

其他 2020-04-03 21:19:47 阅读次数: 0

本文的方法第一步是对矩阵做定点分解，第二步是做全精度的权值的恢复，第三步是权值balancing，最后一步是fine-tuning。

在这里插入图片描述

同样是一个8*8的矩阵，把权值分解成两个矩阵的乘积形式，保证分解后的两个矩阵是一个定点表示，分解出来的左边矩阵，是一个ternary，右边是ternary的一个表示，中间有一个全精度的，浮点的，对称的矩阵，相当于一个尺度因子。
在这里插入图片描述

一个直观的解释，如果不考虑正负，他会选择某些行某些列，根据这些行和列选出来的位置用同一个权值表示，对选出来的行和列做一个重排，这些行业这些例都是一个值，另一行另一列是另一个值。
具体到神经网络，就是给定一个权值矩阵，做分解，保证x和y是ternay的形式。

有了这样一种分解方式以后，

后面要做一个fine tuning，在做fine tuning的阶段，因为做了这样的矩阵分解以后，全精度的权值就消失了，在fine tuning的时候肯定需要全精度的权值，来做误差的累积。所以需要把权值恢复出来。

所以本文作者提出了一种方法恢复全精度的权值，思路是把问题转化成优化问题，就是还是去拟合原始的全精度的w，
在这里插入图片描述

另一个方法就是对权值做均衡，

比如把w分解成p和q，这样一层网络会变成两层，在反向传播的时候，如q乘一个系数，比如乘上10，p除10，计算出来的q的梯度，是缩小了10倍，p的梯度增加了10倍，所以scale在神经网络训练中是一个非常重要的在这里插入图片描述
x乘一个系数，y乘一个系数，d乘一个系数，来评估它们之间的scale
通过实验证明不做权值均衡，三层网络的梯度差别很大，做了权值均衡以后，三层网络的梯度都在0.1范围内。

ref
https://zhuanlan.zhihu.com/p/70427660

rrr2

发布了452 篇原创文章 · 获赞 271 · 访问量 73万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/qq_35608277/article/details/104833798

固定点分解网络Fixed-point Factorized Networks

【论文阅读】Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks

Factorized TDNN（因子分解TDNN，TDNN-F）

胶囊网络 -- Capsule Networks

Capsule Networks 胶囊网络

Neural Networks（神经网络）

Neural Networks(神经网络)

Factorized Hidden Variability Learning For Adaptation Of Short Duration Language Identification Models

get to the point:summarization with pointer-generator networks

[配翻译]A Fixed-Point Introduction by Example

残差网络（Residual Networks, ResNets）

GRAPH CONVOLUTIONAL NETWORKS（图卷积网络）（转载）

网络爬虫-distil networks反爬虫服务

docker-compose网络设置之networks

空间变换网络（Spatial Transform Networks，STN）

空间变换网络Spatial Transformer Networks(STN)

Understanding LSTM Networks（LSTM的网络结构）

全卷积网络 Fully Convolutional Networks

理解 LSTM 网络（Understanding LSTM Networks by colah）

FPN(Feature Pyramid Networks)网络学习

二值网络--Binarized Neural Networks

Neural Networks Learning(神经网络学习)

对抗生成网络 Generative Adversarial Networks

回声状态网络ESN（Echo State Networks）

对 Spatial Transformer Networks(空间变换网络) 的思考

在线社交网络（Online Social Networks，OSNs）

NLP Neural Networks -nlp神经网络

【GCN】图卷积网络 Graph Convolutional Networks

STN -Spatial Transformer Networks 空间转换网络

[Lecture 4] Neural Networks（神经网络）

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)