吴恩达深度学习笔记（8）-重点-梯度下降法（Gradient Descent） - 代码天地

吴恩达深度学习笔记（8）-重点-梯度下降法（Gradient Descent）

其他 2018-11-24 11:10:45 阅读次数: 0

梯度下降法（Gradient Descent）（重点）

梯度下降法可以做什么？

在你测试集上，通过最小化代价函数（成本函数） J(w,b) 来训练的参数w和b ，

在这里插入图片描述

如图，在第二行给出和之前一样的逻辑回归算法的代价函数（成本函数）(上一篇文章已讲过）

梯度下降法的形象化说明

图片描述(最多50字)

在这个图中，横轴表示你的空间参数w 和 b ，在实践中，w可以是更高的维度，但是为了更好地绘图，我们定义 w 和b，都是单一实数，代价函数（成本函数）J(w,b)是在水平轴w和b上的曲面，因此曲面的高度就是 J(w,b)在某一点的函数值。我们所做的就是找到使得代价函数（成本函数）J(w,b)函数值是最小值，对应的参数w 和b 。

图片描述(最多50字)

如图，代价函数（成本函数） J(w,b) 是一个凸函数(convex function)，像一个大碗一样。

图片描述(最多50字)

如图，这就与刚才的图有些相反，因为它是非凸的并且有很多不同的局部最小值。由于逻辑回归的代价函数（成本函数) J(w,b) 特性，我们必须定义代价函数（成本函数） J(w,b) 为凸函数。初始化w和b ，

图片描述(最多50字)

可以用如图那个小红点来初始化参数w和b ，也可以采用随机初始化的方法，对于逻辑回归几乎所有的初始化方法都有效，因为函数是凸函数，无论在哪里初始化，应该达到同一点或大致相同的点。

在这里插入图片描述
我们以如图的小红点的坐标来初始化参数w和 b。

朝最陡的下坡方向走一步，不断地迭代

图片描述(最多50字)

我们朝最陡的下坡方向走一步，如图，走到了如图中第二个小红点处。

在这里插入图片描述
我们可能停在这里也有可能继续朝最陡的下坡方向再走一步，如图，经过两次迭代走到第三个小红点处。

直到走到全局最优解或者接近全局最优解的地方

通过以上的三个步骤我们可以找到全局最优解，也就是代价函数（成本函数）这个凸函数的最小值点。

梯度下降法的细节化说明（仅有一个参数）

(这是一个二维的，较好理解些）

图片描述(最多50字)

假定代价函数（成本函数）J（w）只有一个参数w，即用一维曲线代替多维曲线，这样可以更好画出图像。
图片描述(最多50字)

图片描述(最多50字)

迭代就是不断重复做如图的公式:

: 表示更新参数, a 表示学习率（learning rate），用来控制步长（step），即向下走一步的长度

图片描述(最多50字)
就是函数J(w)对 w求导（derivative），在代码中我们会使用dw表示这个结果

图片描述(最多50字)

对于导数更加形象化的理解就是斜率（slope），如图该点的导数就是这个点相切于J(w)的小三角形的高除宽。假设我们以如图点为初始化点，该点处的斜率的符号是正的，即

在这里插入图片描述

所以接下来会向左走一步。

图片描述(最多50字)

整个梯度下降法的迭代过程就是不断地向左走，直至逼近最小值点。
图片描述(最多50字)

假设我们以如图点为初始化点，该点处的斜率的符号是负的，即

图片描述(最多50字)
所以接下来会向右走一步。

在这里插入图片描述
整个梯度下降法的迭代过程就是不断地向右走，即朝着最小值点方向走。

梯度下降法的细节化说明（两个参数）

逻辑回归的代价函数（成本函数）J(w,b) 是含有两个参数的。

图片描述(最多50字)

δ表示求偏导符号，可以读作round，

在这里插入图片描述

就是函数J(w,b)对w求偏导，在代码中我们会使用dw表示这个结果。
图片描述(最多50字)
就是函数J(w,b)对b求偏导，在代码中我们会使用 db表示这个结果，

小写字母d 用在求导数（derivative），即函数只有一个参数，偏导数符号 δ 用在求偏导（partial derivative），即函数含有两个以上的参数。

这篇文章中会用到求导和偏导的相关知识，如果不懂的话，可能要去补习下知识咯！

不过不用担心，下一篇文章就是会讲到这些知识点，可以看下一篇的讲解了解！

猜你喜欢

转载自blog.csdn.net/Harpoon_fly/article/details/84351023

吴恩达深度学习笔记（8）-重点-梯度下降法（Gradient Descent）

【吴恩达深度学习专栏】神经网络的编程基础(Basics of Neural Network programming)——梯度下降法（Gradient Descent）

吴恩达深度学习：2.3梯度下降Gradient Descent

【吴恩达机器学习笔记】005 梯度下降（Gradient Descent）

吴恩达机器学习笔记60-随机梯度下降算法、小批量梯度下降算法（Stochastic Gradient Descent& Mini-Batch Gradient Descent）

梯度下降法 Gradient Descent

梯度下降法(Gradient descent)

Gradient Descent：梯度下降法

梯度下降（Gradient Descent）

梯度下降 — Gradient Descent

梯度下降 Gradient Descent

The Gradient Descent---梯度下降（Gradient Descent）

【吴恩达机器学习学习笔记03】Gradient Descent

机器学习笔记——梯度下降（Gradient Descent）

Machine Learning：Gradient Descent（梯度下降法）

Gradient descent algorithm 梯度下降法

梯度下降法(Gradient Descent)初识

梯度下降法Gradient_descent

全是干货的梯度下降法（Gradient descent）

机器学习之梯度下降法(Gradient Descent)

机器学习入门 04 梯度下降法（Gradient Descent）

机器学习算法之_梯度下降法（Gradient Descent）

【吴恩达深度学习专栏】神经网络的编程基础(Basics of Neural Network programming)——m 个样本的梯度下降(Gradient Descent on m Example

【吴恩达深度学习专栏】浅层神经网络(Shallow neural networks)——神经网络的梯度下降（Gradient descent for neural networks）

Gradient descent

ML重要概念：梯度（Gradient）与梯度下降法（Gradient Descent）

梯度下降（Gradient Descent）小结

（二）梯度下降(Gradient Descent)

深入梯度下降(Gradient Descent)

3、Gradient Descent（梯度下降）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)