吴恩达深度学习总结(1)

其他 2018-10-20 12:11:16 阅读次数: 0

DeaplearningAI01.weak2

forward
backward

本周主要介绍了神经网络中forward和backward的一般实现和向量实现。一般实现较为简单，向量实现中存在一些疑点
$\boldsymbol{X}$ 是一个由训练集组成的矩阵，每一列代表一个数据，列数为数据的大小
$\boldsymbol{\omega}$ 是训练参数，大小与 $\boldsymbol{X}$ 一列的大小一致
$b$ 为偏差(bias)，为一个标量

forward

$\boldsymbol{Z} = np.dot(\boldsymbol{\omega}.T,\;\boldsymbol{X}) + b$
$\boldsymbol{A} = \sigma(\boldsymbol{Z})$ ，其中 $\sigma(\boldsymbol{x}) = \frac{1}{1-e^{-\boldsymbol{x}}}$
通过编程实现为 $1/(1-np.exp(-\boldsymbol{X}))$
Cost Function(Loss Function)通过矩阵实现时应该注意Cost Function是将所有的预测误差相加取平均得到的，不可以直接用矩阵乘法使其变为标量
$L = 1/m*np.sum((-\boldsymbol{Y}*np.log(\boldsymbol{A})+(1-\boldsymbol{Y})*np.log(1-\boldsymbol{A})))$ ，其中m为样本的个数

backward

backward实际上是一个链式求导的过程，backward最根本的式子是通过梯度下降法来更新w和b
$\frac{\partial L}{\partial \boldsymbol{A}} = -(\frac{\boldsymbol{Y}}{\boldsymbol{A}}-\frac{1-\boldsymbol{Y}}{1-\boldsymbol{A}}) \frac{\partial \boldsymbol{A}}{\partial \boldsymbol{\boldsymbol{Z}}} = \boldsymbol{A}(1-\boldsymbol{A}) \frac{\partial \boldsymbol{Z}}{\partial \boldsymbol{\omega}} = \boldsymbol{X}$
所以，我们可以表示 $d\omega$ 为 $d\omega = np.dot(\boldsymbol{X},\;(\boldsymbol{A} - \boldsymbol{Y}).T)$ ，这个求解出来为m个样本训练出w的变化总和，因此应该除以m，所以为 $d\omega =1/m* np.dot(\boldsymbol{X},\;(\boldsymbol{A} - \boldsymbol{Y}).T)$ 。
同理可求 $db$ ，但是由于b为标量，因此需要对求出的m次训练的b求和，即 $db = 1/m*np.sum(\boldsymbol{A}-\boldsymbol{Y})$ 。根据这两个值即可以更新 $\omega$ 和 $b$

猜你喜欢

转载自blog.csdn.net/qq_33669204/article/details/83039620

吴恩达深度学习总结(1)

吴恩达深度学习总结(4)

吴恩达深度学习总结(2)

吴恩达深度学习总结（13）

吴恩达深度学习总结（11）

吴恩达深度学习总结（10）

吴恩达深度学习总结（8）

吴恩达深度学习总结（7）

吴恩达深度学习总结(6)

吴恩达深度学习总结（14）

吴恩达深度学习总结（12）

吴恩达深度学习总结(5)

吴恩达深度学习总结（15）

吴恩达深度学习课程：1、深度学习概论

吴恩达深度学习笔记（1）-深度学习引言

吴恩达深度学习

吴恩达《deeplearning深度学习》课程学习笔记【1】（精简总结）

吴恩达深度学习课程学习总结

吴恩达Coursera深度学习课程 course1-week2 总结

吴恩达深度学习笔记（1-14）总结-神经网络基础

吴恩达老师深度学习视频课笔记：总结

吴恩达《深度学习》专项课程总结

关于吴恩达深度学习总结(一)

吴恩达深度学习知识点总结（复习）

3.12 总结-深度学习-Stanford吴恩达教授

2.19 总结-深度学习-Stanford吴恩达教授

Coursera吴恩达《深度学习》课程总结（全）

深度学习系列作业1----by 吴恩达

吴恩达深度学习课程笔记-1

吴恩达Coursera深度学习课程 course2-week1 深度学习的实践层面总结

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)