Deep Learning Specialization课程笔记——浅层神经网络 - 代码天地

Deep Learning Specialization课程笔记——浅层神经网络

其他 2018-05-06 21:59:58 阅读次数: 3

Neural Network Overview

一个神经元构成（其中a=yhat）：

那么，当有两层隐藏层时，具体的计算过程，是每层有每层的w和b，进行上述z[1]->a[1]->z[2]->a[2]->L的运算，其中z[1]和z[2]的输入分别为w[1]，b[1]和w[2]，b[2]。同样，在神经网络中，也会像逻辑回归一样，计算后向传播的da[2]，dz[2]，dw[2]，db[2]和da[1]，dz[1]，dw[1]，db[1]。

Neural Network Representation

隐藏层之所以叫隐藏层，是因为中间这一层节点的真实值不能被观察到。

通常，我们不包括输入层为正式层（把它叫做第0层），所以把有一层隐藏层的神经网络叫做两层神经网络。

Computing a Neural Network's Output

神经网络的计算细节简单来说是将逻辑回归的多次重复。

此时用for_loop效率很低，下面是向量化，把每层的n个节点合在一起得到：

Vectorizing

神经网络如何实现计算所有实例呢？

横着看是对不同训练样本，竖着看是不同结点。

Activation functions

在a=theta(z)这步除了sigmoid函数也能有一些其他选择。

其中的一个选择：a=tanh(z)=(e^z-e^(-z))/(e^z+e^(-z)) 是sigmoid(z)在(-1,1)范围内的移位。也可以在隐藏层a=tanh(z)而在输出层a=sigmoid(z)。

线性整流函数：a=ReLu(z)=max(0,z)，此时，z<0，a=0，在实际操作中，通常只会遇到z=0.0000000001的情况。ReLu函数是目前隐藏层广为使用的函数。

另外有a=Leaky ReLu(z)=max(0.01z,z)，z<0时有很小的值。

why non-linear Activation functions

若直接令a=z，则会出现

那么可以看到，输出仅仅是输入的线性变化，那么神经网络就失去了意义，相当于没有隐藏层。

当处理回归问题时，可以在输出层使用线性激活函数，这时的输出yhat，就可以为任意实数。但在隐藏层，通常不使用线性激活函数。

Derivatives of Activation functions

a=sigmiod(z): a'=a(1-a)

a=tanh(z): a'=1-a^2

a=ReLU(z): a'=0 if z<0 a'=1 if z>=0

a=Leaky ReLU(z) a'=0.01 if z<0 a'=1 if z>=0

Gradient desecent for Neural Networks

Random Intialization

为什么要把权重参数进行随机初始化呢？

如果把w1，w2，b1，b2的初始化值都设为0，那么会计算出完全相同的两个隐藏单元a1和a2，经过每次迭代后，两个隐藏单元的功能都相同，神经网络失去了意义。

那么为什么w值取得很小呢？

这样在tanh或sigmoid的激活函数时，斜率比较大，意味着初始梯度下降时步长比较大。

猜你喜欢

转载自blog.csdn.net/weixin_37805505/article/details/79752798

Deep Learning Specialization课程笔记——浅层神经网络

Deep Learning Specialization课程笔记——神经网络基础

Deep Learning Specialization课程笔记——深层神经网络

Deep Learning Specialization课程笔记——神经网络编程基础

吴恩达deep learning ai 笔记总结(1-3) 神经网络与深度学习-浅层神经网络

【Deep Learning笔记】循环神经网络

【Deep Learning笔记】神经网络基础

Deep Learning Specialization课程笔记——深度学习介绍

Deep Learning Specialization课程笔记——最优化算法

Deep Learning Specialization课程笔记——正则化和最优化

Ng deep learning 专项课程第四门CNN卷积神经网络课程笔记一

吴恩达 deep learning 第三周浅层神经网络

deep_learning(吴恩达) 第三周 –浅层神经网络_01

Deep Learning - 1 神经网络

[Deep Learning] 神经网络基础

【Deep learning】循环神经网络RNN

Deep learning 与传统的神经网络的区别

Deep Learning 循环神经网络

【Deep Learning笔记之卷积神经网络的架构】

Deep Learning 学习笔记

Deep Learning 简略笔记

deep learning实验笔记

Neural Networks and Deep Learning 课程笔记（第四周）深层神经网络（Deep Neural Networks）

Coursera-Deep Learning Specialization 课程之（一）：Neural Networks and Deep Learning-weak2

Coursera-Deep Learning Specialization 课程之（一）：Neural Networks and Deep Learning-weak1

Deep learning 论文笔记

Deep Learning With Python 学习笔记

花书《Deep Learning》笔记

Neural Networks and Deep Learning 笔记

《Deep Learning》学习笔记（一）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)