谷歌机器学习速成课程笔记 15（Training Neural Networks -训练神经网络） - 代码天地

谷歌机器学习速成课程笔记 15（Training Neural Networks -训练神经网络）

其他 2018-09-11 01:24:47 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_30354455/article/details/80494338

在思考如何训练神经网络是，首先我们需要了解哪些信息是与反向传播有关的。
（我们不需要了解反向传播的实施方式/原理机制，因为tensorflow 会为我们做好）
这里写图片描述

首先，反向传播确实依赖于梯度这个概念——事物必须是可微的（函数中存在一两个小的间断点没关系）这样我们才能够使用神经网络进行学习。
另外，要注意，梯度可能会消失。如果我们的网络太过深入，信噪比随着您深入模型而变差，那么学习速度可能会变得非常慢。在这情况下，可以使用ReLU或其他策略，但一般来说，我们需要尽量地将模型深度限制为“ 最小有效深度 ”。
另外，还需要知道，梯度可能会分解，如果学习速率太高，就会出现极不稳定的情况，模型中可能出现NaN，这时就要以较低的学习率再试一次
最后，要知道，ReLU可能会消失。这可能是因为我们将硬性上限设为0，导致最终所有内容都低于0，这样梯度就无法反向传播了，我们就永远无法返回存在ReLU层的位置。所以要密切关注，使用不同的初始化，或者较低的学习率重试。

这里写图片描述
通常推荐的特征值范围是[-1, 1]，范围值并不重要，也可以是[-5, 5]，[0, 1]，只要所有输入的范围大致相同就行，这有助于提高神经网络的转化速度。

这里写图片描述
应用丢弃——针对概率P取一个节点，然后从网络的一个梯度步长中将其移除，在其他梯度步长中重复此过程，并随机取不同的节点就行丢弃。
丢弃的节点越多，正则化的效果越强。

如果丢弃所有节点，就会得到一个极为简单、毫无是处的模型；
如果一个都不丢弃，模型将具备完整的复杂性；
如果在训练过程中的某个位置进行丢弃，那就相当于在这个位置应用了某种有效的正则化。

猜你喜欢

转载自blog.csdn.net/qq_30354455/article/details/80494338

谷歌机器学习速成课程笔记 15（Training Neural Networks -训练神经网络）

MLCC笔记15 - 训练神经网络 (Training Neural Networks)

谷歌机器学习速成课程笔记 16（Multi-Class Neural Networks-多类别神经网络）

CNN笔记（CS231N）——训练神经网络II（Training Neural Networks, Part 2）

CNN笔记（CS231N）——训练神经网络I（Training Neural Networks, Part I）

Google---机器学习速成课程(十二)- 神经网络简介 (Introduction to Neural Networks)

Neural Networks and Convolutional Neural Networks Essential Training 神经网络和卷积神经网络基础教程 Lynda课程中文字幕

Neural Networks Learning(神经网络学习)

训练神经网络（CS231n 7. Training Neural Networks II）

CS231n 7. Training Neural Networks II 训练神经网络

[Lecture 7 ] Training Neural Networks II（训练神经网络II）

[Lecture 6 ] Training Neural Networks I（训练神经网络I）

机器学习笔记——神经网络（neural networks）

谷歌机器学习速成课程笔记 14（Introduction of Neural Network-神经网络简介）

Neural Networks（神经网络）

Neural Networks(神经网络)

MLCC笔记14 - 神经网络简介 (Introduction to Neural Networks)

神经网络和深度学习(Neural Networks and Deep Learning)

[神经网络学习笔记]卷积神经网络CNN（Convolutional Neural Networks, CNN）综述

Neural Networks and Deep Learning 课程笔记（第四周）深层神经网络（Deep Neural Networks）

吴恩达机器学习课程笔记+代码实现(11)8.神经网络的学习(Neural Networks: Learning)

神经网络不同激活函数比较--读《Understanding the difficulty of training deep feedforward neural networks》

吴恩达机器学习课程笔记+代码实现(10)神经网络：表述(Neural Networks: Representation)

Stanford机器学习---第五讲. 神经网络的学习 Neural Networks learning Stanford机器学习---第五讲. 神经网络的学习 Neural Networks learning

【吴恩达深度学习专栏】浅层神经网络(Shallow neural networks)——神经网络概述（Neural Network Overview）

【吴恩达深度学习专栏】浅层神经网络(Shallow neural networks)——神经网络的表示（Neural Network Representation）

NLP Neural Networks -nlp神经网络

[Lecture 4] Neural Networks（神经网络）

递进神经网络：Progressive Neural Networks

图神经网络（Graph Neural Networks）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)