Training Neural Networks, part II - 代码天地

Training Neural Networks, part II

其他 2020-01-27 11:30:18 阅读次数: 0

part II :

- Fancier optimization

- Regularization

- Transfer Learning

Optimization

Problems with SGD

1.

当我们在水平方向变化时，损失函数的变化非常慢

而在竖直方向（等高线方向）变化时，损失值变化很快

在这样函数上，SGD：

Very slow progress along shallow dimension, jitter along steep direction

2. 局部极小值（local minima），鞍点(saddle points)

local minima:

Zero gradient, gradient descent gets stuck

saddle points:

Saddle points much more common in high dimension

解决方法：

SGD + Momentum

Nesterov Momentum

用换元法改进一下，以便于求loss,gradient

AdaGrad

当沿一个轴有很小的梯度时，在更新参数时除以累加梯度平方，得到一个比较大的值，从而加快学习速度

当沿一个轴有很大的梯度时，在更新参数时除以累加梯度平方，得到一个比较小的值，从而减慢学习速度

随着时间的增加，步长会越来越小，这一特点在凸函数中表现很好，但在非凸函数时会有问题 ---> RMSProp

RMSProp

Adam(almost)

在第一次循环的时候，second_moment 可能接近0，会导致步长非常大。---->

Adam (full form)

About learning rate

通常首先选择一个不带衰减的，不错的学习率，查看结果如何，仔细观察损失曲线，决定在哪个地方开始衰减

二次逼近

模型集成

用于减小训练和测试之间的误差差距

Regularization

提升单一模型的表现，防止过拟合

1.

2. dropout

若是在意 test 的效率，也可以：

3. Batch Normalization

加入一些随机性的元素：

4. Data Augmentation

可以做水平翻转

可以抽取不同尺度大小的裁剪图像，在测试时，评估一些固定的裁剪图像

可以做色彩抖动：

还可以：

5. DropConnect

6. Fractional Max Pooling

7. Stochastic Depth

Transfer Learning

在小样本中更好的训练，防止过拟合

冻结前部分，调整后部分

数据集很小时：

1.找到一个有类似数据的非常大的数据集，在那里训练一个大的convnet

2.在你的数据集做迁移学习

Caffe: https://github.com/BVLC/caffe/wiki/Model-Zoo

TensorFlow: https://github.com/tensorflow/models

PyTorch: https://github.com/pytorch/vision

Summary

_likyoo

发布了55 篇原创文章 · 获赞 22 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/li_k_y/article/details/86701257

Training Neural Networks, part II

Training Neural Networks, part I

Lecture 6: Training Neural Networks, Part I

CNN笔记（CS231N）——训练神经网络II（Training Neural Networks, Part 2）

Machine Learning - Neural Networks Representation Part II

A Recipe for Training Neural Networks [中文翻译, part 1]

[Lecture 7 ] Training Neural Networks II（训练神经网络II）

Population Based Training of Neural Networks

（转）A Recipe for Training Neural Networks

【CS231n】Lecture 6：Training Neural Networks,Part 2

CNN笔记（CS231N）——训练神经网络I（Training Neural Networks, Part I）

CS231n Lecture6-Training Neural Networks, part I学习笔记

训练神经网络（CS231n 7. Training Neural Networks II）

CS231n 7. Training Neural Networks II 训练神经网络

CS231n课程笔记：Leture7 Training Neural Networks II

Bag of Freebies for Training Object Detection Neural Networks

Mixed-Precision Training of Deep Neural Networks

Domain-Adversarial Training of Neural Networks

A Recipe for Training Neural Networks 博客翻译

Deformable Part Models are Convolutional Neural Networks

On the difficulty of training Recurrent Neural Networks中RNN完美复现

1506.01186-Cyclical Learning Rates for Training Neural Networks

【阅读笔记】Differentiable plasticity: training plastic neural networks with backpropagation

【阅读笔记】Training Deep Neural Networks on Imbalanced Data Sets

《Understanding the difficulty of training deep feedforward neural networks》笔记

Training Neural Networks with Weights and Activations Constrained to +1 or -1论文阅读

DiracNets: Training Very Deep Neural Networks Without Skip-Connections

MLCC笔记15 - 训练神经网络 (Training Neural Networks)

《Bag of Freebies for Training Object Detection Neural Networks》论文理解

Xavier——Understanding the difficulty of training deep feedforward neural networks

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)