神经网络和深度学习（三）深层神经网络 - 代码天地

神经网络和深度学习（三）深层神经网络

其他 2019-11-05 22:34:10 阅读次数: 0

1、深层神经网络中的前向传播：

（1）单数据情况：

z^[1] = w^[1]x + b^[1]

a^[1] = g^[1](z^[1])

z^[2] = w^[2]a^[1] + b^[2]

a^[2] = g^[2](z^[2])

... ...

z^[l] = w^[l]a^[l-1] + b^[l]

a^[l] = g^[l](z^[l]) = y^

（2）向量化情况：

Z^[1] = W^[1]X + b^[1]

A^[1] = g^[1](Z^[1])

Z^[2] = W^[2]A^[1] + b^[2]

A^[2] = g^[2](Z^[2])

... ...

Z^[l] = W^[l]A^[l-1] + b^[l]

A^[l] = g^[l](Z^[l]) = Y^

2、神经网络矩阵的维数：

（1）单数据情况：

a^[l]、z^[l]、b^[l]、db^[l] : (n^[l], 1)

w^[l]、dw^[l] : (n^[l], n^[l-1])

（2）向量化情况：

A^[l]、Z^[l] : (n^[l], m)

b^[l]、db^[l] : (n^[l], 1)

W^[l]、dW^[l] : (n^[l], n^[l-1])

3、神经网络块：

4、深层神经网络中的反向传播：

（1）单数据情况：

dz^[l] = da^[l] * g^[l]'(z^[l]) ( = a^[l] - y)

dw^[l] = dz^[l]a^[l-1]T

db^[l] = dz^[l]

da^[l-1] = w^[l]Tdz^[l]

dz^[l-1] = da^[l-1] * g^[l-1]'(z^[l-1])

... ...

（2）向量化情况：

dZ^l] = dA^[l] * g^[l]'(Z^[l]) ( = A^[l] - Y)

dW^[l] = 1/m * dZ^[l]A^[l-1]T

dB^[l] = 1/m * np.sum(dZ^[l], axis=1,keepdims=True)

dA^[l-1] = W^[l]TdZ^[l]

dZ^[l-1] = dA^[l-1] * g^[l]'(Z^[l])

... ...

5、参数与超参数：

parameters：W^[1]，b^[1]，W^[2]，b^[2]，... ...

hyper parameters：需要自己设定的参数，如：learning rate; #iterations; #hidden layer; #hidden units; #choice of activation function.

猜你喜欢

转载自www.cnblogs.com/orangecyh/p/11799540.html

深度学习(三)深层神经网络

神经网络和深度学习（三）深层神经网络

深度学习-深层神经网络

4.1深度学习与深层神经网络

深度学习（2）——深层神经网络

【深度学习笔记】深层神经网络

吴恩达神经网络与深度学习章节笔记（三）——深层神经网络

第一门课神经网络和深度学习(深层神经网络4)

01. 神经网络和深度学习 ——week4 深层神经网络

(1-2)神经网络与深度学习 | 浅层和深层神经网络

01.神经网络和深度学习 W4.深层神经网络

深层神经网络

神经网络和深度学习--神经网络基础

浅层神经网络和深层神经网络介绍

深度学习笔记（三）——神经网络和深度学习（神经网络基础二）

01.神经网络和深度学习 W4.深层神经网络（作业：建立你的深度神经网络+图片猫预测）

Coursera吴恩达《神经网络与深度学习》课程笔记（5）-- 深层神经网络

神经网络与深度学习任务 —— 5 深层神经网络应用：图像分类

04.神经网络与深度学习-第四周-深层神经网络

【Ng 深度学习课程总结】04. 改善深层神经网络 ——卷积神经网络

Coursera吴恩达课程笔记 1.5《神经网络与深度学习》-- 深层神经网络

神经网络与深度学习四：建立多层的深层神经网络

01. 神经网络和深度学习 —— week4 深层神经网络（编程作业）

第一门课：神经网络和深度学习（第四周）——深层神经网络

深层神经网络--Tensorflow实战google深度学习框架

1.4）深度学习笔记------深层神经网络

改善深层神经网络（一）深度学习的实用层面

深度学习入门笔记（七）：深层神经网络

改善深层神经网络一| 深度学习的实用层面

吴恩达深度学习——深层神经网络

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)