Deep Learning Specialization课程笔记——深层神经网络 - 代码天地

Deep Learning Specialization课程笔记——深层神经网络

其他 2018-05-06 21:59:43 阅读次数: 4

Forward Propagation in a Deep Network

对第l层来说：

Z^[l]=W^[l]*A^[l-1]+b^[l]

A^[l]=g^[l](Z^[l])

这个地方是可以对1...l...n层做一个for loop。

Getting your matrix dimensions right

W^[l]的维度为(n^[l],n^[l-1])，b^[l]的维度为(n^[l],1)

dW的维度和W一致，db的维度和b一致。

Z^[l]的维度是(n^[l],m)，A^[l]的维度是(n^[l-1],m)

Why deep?

在面部识别的这个例子中，第一层是边缘检测，之后是面部不同部位，最后到不同的面部。这是一个卷积神经网络的例子。

Building blocks of deep neural networks

对深度神经网络的第l层进行讨论：

其中，cache Z^[l]是因为，把Z^[l]的值存起来对反向传播很有用。

在前向的每一层中，都保存了Z^[l]的值，最终得到a^[n]即yhat的值，在计算出da^[n]后，不断后向传播，得到每一层的dW和db(这时使用了每一层缓存下来的Z^[l])，用它们的值来更新每一层的W和b(W:=W-alpha*dW b:=b-alpha*db)

Forward and Backward Propagation

就是浅层神经网络的l层扩展版本，非常好理解。前向的向量化在这篇文章的第一小节，这里贴一下后向的向量化：

前向传播时用输入数据X来初始化，那么反向传播呢？

答案是，我们令da^[n]=-y/a+(1-y)/(1-a)，这是损失函数对yhat(即a^[n])的求导。

在向量化之后，dA^[l]的结果变为了dA^[l]=sum(-y/a+(1-y)/(1-a))在m个样本上的求和。

Parameters and Hyperparameters

在神经网络中，常见的参数是W和b，那么什么是超参数呢？

超参数包括学习率alpha，迭代次数，隐藏层层数，隐藏单元数，激活函数的选择（使用ReLU,tanh还是sigmoid），这些称为超参数，因为这些参数都会影响W和b的最终结果。换句话说，超参数即是决定参数的参数。

猜你喜欢

转载自blog.csdn.net/weixin_37805505/article/details/79772647

Deep Learning Specialization课程笔记——深层神经网络

Deep Learning Specialization课程笔记——浅层神经网络

Deep Learning Specialization课程笔记——神经网络编程基础

Deep Learning Specialization课程笔记——神经网络基础

Neural Networks and Deep Learning 课程笔记（第四周）深层神经网络（Deep Neural Networks）

【Deep Learning笔记】循环神经网络

【Deep Learning笔记】神经网络基础

吴恩达deep learning ai 笔记总结(1-4) 神经网络与深度学习-深层神经网络

Deep Learning Specialization课程笔记——最优化算法

Deep Learning Specialization课程笔记——深度学习介绍

Deep Learning Specialization课程笔记——正则化和最优化

Ng deep learning 专项课程第四门CNN卷积神经网络课程笔记一

Deep Learning - 1 神经网络

[Deep Learning] 神经网络基础

【Deep learning】循环神经网络RNN

Deep learning 与传统的神经网络的区别

Deep Learning 循环神经网络

吴恩达deep learning ai 笔记总结(2-2) 改善深层神经网络-优化算法

吴恩达deep learning ai 笔记总结(2-1) 改善深层神经网络-深度学习的实践方面

【Deep Learning笔记之卷积神经网络的架构】

Deep Learning 学习笔记

Deep Learning 简略笔记

deep learning实验笔记

Coursera-Deep Learning Specialization 课程之（一）：Neural Networks and Deep Learning-weak2

Coursera-Deep Learning Specialization 课程之（一）：Neural Networks and Deep Learning-weak1

Deep learning 论文笔记

Deep Learning With Python 学习笔记

花书《Deep Learning》笔记

Neural Networks and Deep Learning 笔记

《Deep Learning》学习笔记（一）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)