CNN调参笔记 - 代码天地

CNN调参笔记

其他 2018-06-24 05:42:40 阅读次数: 4

一、卷积层weight和bias初始化(Mnist)

weight的mean为0，标准差待定，bias为常数，待定。

（1）Bias初始化太大（比如0.5，weight std=0.01），则网络loss初始非常大，即使加了BN层使得Loss减小，亦难以收敛。

我猜测是Bias太大，其在与Feature Map的博弈中，占了绝对上方，特别是多层网络，原始图的特征逐层递减直至消失。

（2）Bias和weigh较小(比如Bias=0.0, weight stddev=0.01)，网络可以收敛，但收敛较慢

（3）Mnist图片反色（即foreground像素值在0这一端，background在255这一端）后收敛速度下降较大（目测2~3倍）。

（4）Bias=0.1 ,weight stddev=0.1 网络收敛较快。但

看了xavier和he_normal两篇论文，主要是保证feedforward/backpropagation的梯度在传递过程中，每一层分布不变(均值+方差)。

感觉无脑用就好了。(不过测试时，7、8层的网络使用xavier/he_normal效果并不比N(0,0.01))效果更好)

二、Learning Rate

设置太大无法收敛，比如1e-2。

ResNet中以0.1为初值训练不知怎么回事。

三、BN层顺序：一个不收敛的例子

当我们采用x->bn->relu->weight的放置顺序，有些情况会导致无法收敛。分析如下：

我们假设图片像素值为0~10，黑色(0)为前景色，白色(10)为背景色。

考虑图片某一行的像素值：（其中像素0位前景色，5，6，7，8，10为背景色）

x-> [10 5 6 0 7 8]，mean=6.0，variance=9.667

经过bn层处理

bn(x) -> [-1.92980254, -0.3216337 , 0. , 0.3216337 , 0.64326751, 1.28653514]

再经过relu处理

relu(bn(x))->[0,0,0, 0.3216337 , 0.64326751, 1.28653514]

好了，现在发现前景像素0已经完美和背景像素5,6溶为一体了，此时的图片应该已经变得模糊不清了。

而当图片反色后却不会出现这种情况。

猜你喜欢

转载自blog.csdn.net/vcvycy/article/details/78639929

CNN调参笔记

deep learning（rnn、cnn）调参的经验

CNN调参：学习率（一）

LightGBM调参笔记

深度学习调参笔记

你有哪些deep learning（rnn、cnn）调参的经验？

【CNN调参】目标检测算法优化技巧

Sklearn笔记--逻辑回归调参指南

调参

CNN调参：利用损失函数权重处理不平衡数据集（二）

（干货）经验之谈：DeepLearning---CNN调参策略（一）

深层CNN的调参经验 | A practical theory for designing very deep convolutional neural networks

【干货】基于pytorch的CNN、LSTM神经网络模型调参小结

深度学习 14. 深度学习调参，CNN参数调参，各个参数理解和说明以及调整的要领。underfitting和overfitting的理解，过拟合的解释。

【机器学习笔记】GBM以及xgboost的调参汇总

DeepLearning学习笔记（1）“调参之路”_ by HZC

scikit-learn 梯度提升树(GBDT)调参笔记

建模——模型超参数调参笔记1

【机器学习】随机森林及调参学习笔记

【模型调参】Lgb调参方法

cnn调优总结

CNN怎么调参数？

xgboost使用调参

RandomForest 调参

XGBoost调参经验

tensorflow 调参过程

机器学习——调参

深度模型调参

今日调参体会

xgboost调参大法

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)