神经网络和深度学习（二）浅层神经网络 - 代码天地

神经网络和深度学习（二）浅层神经网络

其他 2019-11-03 22:50:47 阅读次数: 0

1、计算神经网络的输出（正向传播）：

矩阵表示：

向量化：

2、多个样本的向量化（正向传播）：

3、激活函数：

（1）sigmoid函数仅用于二分分类的情况，较少使用；

a = 1 / (1 + e^-z)

g'(z) = g(z) * (1 - g(z))

（2）tanh函数绝大多数情况下优于sigmoid函数；

a = (e^z - e^-z) / (e^z + e^-z)

g'(z) = 1 - g(z)²

（3）ReLU函数是默认的常用激活函数；

a = max(0, z)

g'(z) = 0 if z < 0

g'(z) = 1 if z ≥ 0

（4）leaking ReLU 带泄露的ReLU函数；

a = max(0.01z, z)

g'(z) = 0.01 if z < 0

g'(z) = 1 if z ≥ 0

4、神经网络为什么需要非线性激活函数？

假设使用线性激活函数，即a^[1] = z^[1]

a^[1] = z^[1] = w^[1]x + b^[1]

a^[2] = z^[2] = w^[2]a^[1] + b^[2]

　　= w^[2] * (w^[1]x + b^[1]) + b^[2]

　　= (w^[1]w^[2])x + (w^[2]b^[1] + b^[2])

　　= w'x + b'

可见，神经网络只是把输入线性组合再输出.

一般在回归问题中，可能会使用线性激活函数.

5、神经网络中的梯度下降：

6、直观理解反向传播：

da^[2] = dL/da^[2] = -y/a^[2] + (1-y)/(1-a^[2])

dz^[2] = dL/dz^[2] = dL/da^[2] * da^[2]/dz^[2] = [-y/a^[2] + (1-y)/(1-a^[2])] * a^[2](1-a^[2]) = a^[2]-y

dw^[2] = dL/dw^[2] = dL/dz^[2] * dz^[2]/dw^[2] = dz^[1]a^[1]T

db^[2] = dL/db^[2] = dL/dz^[2] * dz^[2]/db^[2] = dz^[2]

da^[1] = dL/da^[1] = dL/dz^[2] * dz^[2]/da^[1] = w^[2]Tdz^[2]

dz^[1] = dL/dz^[1] = dL/da^[1] * da^[1]/dz^[1] = w^[2]Tdz^[2] .* g^[1]'(z^[1])

dw^[1] = dL/dw^[1] = dL/dz^[1] * dz^[1]/dw^[1] = dz^[1]x^T

db^[1] = dL/db^[1] = dL/dz^[1] * dz^[1]/db^[1] = dz^[1]

7、随机初始化：

如果 w 初始值设置为全0，则隐藏单元的每行值都完全相同，即完全对此. 每个隐藏单元的计算完全相同，使得隐藏单元失去作用.

随机初始化方法：

w^[i] = np.random.randn(...) * 0.01

b^[i] = np.zero(...)

乘上 0.01 是为了避免 z^[i] 太大，导致 a^[i] 太大，使得激活函数处于平缓区域（接近饱和），梯度下降速度慢（g'(z)接近0，dz也接近0）.

猜你喜欢

转载自www.cnblogs.com/orangecyh/p/11785526.html

深度学习(二)浅层神经网络

神经网络和深度学习（二）浅层神经网络

深度学习——浅层神经网络

【深度学习笔记】浅层神经网络

吴恩达深度学习神经网络和深度学习浅层神经网络

深度学习笔记（四）——神经网络和深度学习（浅层神经网络）

01.神经网络和深度学习——week3 浅层神经网络

第一门课神经网络和深度学习(浅层神经网络3)

(1-2)神经网络与深度学习 | 浅层和深层神经网络

01.神经网络和深度学习 W3.浅层神经网络

浅层神经网络

吴恩达深度学习神经网络与深度学习浅层神经网络课程作业

吴恩达深度学习 | 神经网络和深度学习（第三周浅层神经网络）

浅层神经网络和深层神经网络介绍

【深度学习_1.3】搭建浅层神经网络模型

1.3）深度学习笔记------浅层神经网络

深度学习（四）浅层神经网络及其向量化

吴恩达深度学习——浅层神经网络

Coursera吴恩达《神经网络与深度学习》课程笔记（4）-- 浅层神经网络

03.神经网络与深度学习-第三周-浅层神经网络

吴恩达神经网络与深度学习——浅层神经网络习题3

吴恩达神经网络与深度学习——浅层神经网络

吴恩达深度学习笔记(15）-浅层神经网络之神经网络概述

Coursera吴恩达课程笔记 1.4《神经网络与深度学习》-- 浅层神经网络

吴恩达神经网络和深度学习第三周浅层神经网络

01. 神经网络和深度学习 —— week3浅层神经网络（编程作业）

第一门课：神经网络和深度学习（第三周）——浅层神经网络

神经网络和深度学习--神经网络基础

01.神经网络和深度学习 W3.浅层神经网络（作业：带一个隐藏层的神经网络）

1.3.1 浅层神经网络

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)