Machine Learning:Parameter Learning——Gradient Descent

其他 2020-02-28 15:13:46 阅读次数: 0

Gradient Descent

当成本函数位于图中凹坑的最底部时，即当其值最小时，我们就成功了。
我们这样做的方法是采用成本函数的导数，切线的斜率是该点的导数，它将为我们提供一个方向，我们沿下降最陡的方向逐步降低成本函数，每步的大小由参数α（称为学习率）确定。
在这里插入图片描述

算法

repeat until convergence:
在这里插入图片描述
where j=0,1 represents the feature index number.

注意：同步更新

每次迭代时，应该同时更新参数θ1，θ2，…，θn，否则在计算偏导数时将出现错误。
在这里插入图片描述

Gradient Descent Intuition

假设只有一个θ1参数时

其迭代算法如下
在这里插入图片描述
无论导函数为多少，θ1最终会收敛到其最小值，如下图当导函数为负数时，θ1的值会增加，当导函数为正数时，θ1的值会减小。

另外，我们应该调整学习率α，过小或过大都不适宜。

因为最终的局部最优解导函数为0，所以尽管学习率α不变，在收敛过程中导函数会逐步变小，梯度下降会自动逐渐采取更小的步子以接近最优解。
在这里插入图片描述

Gradient Descent For Linear Regression

当专门用于线性回归时，可以得到以下等式
在这里插入图片描述
因为该方法着眼于每个步骤的整个训练集中的每个数据，称为批量梯度下降。因为此处为线性回归提出的优化问题只有一个全局最优，因此梯度下降总会收敛到全局最小值（学习率α不太大）

发布了25 篇原创文章 · 获赞 0 · 访问量 1497

私信关注

猜你喜欢

转载自blog.csdn.net/u014681799/article/details/102212236

Machine Learning:Parameter Learning——Gradient Descent

Machine Learning：Gradient Descent（梯度下降法）

Introduction to Gradient Descent Algorithm (along with variants) in Machine Learning

Learning to learn by gradient descent by gradient descent 笔记

【Course】Machine learning：Week 2-Lecture1-Gradient Descent For Multiple Variables

（2017 ICML）Learning to learn without gradient descent by gradient descent笔记

Meta learning paper(一)：Learning to learn by gradient descent by gradient descent (Nips2016)

「Deep Learning」Note on SGDR: Stochastic Gradient Descent with Warm Restarts

【笔记】论文阅读 | Learning to learn using gradient descent

Linear Regression with multiple variables - Gradient descent in practice II: Learning rate

Scaling distributed machine learning with the parameter server

Machine Learning

[Machine Learning] 方向导数&梯度（Directional Derivative & Gradient）

Mu Li, Baidu-Scaling Distributed Machine Learning with the Parameter Server

Deep Learning - Machine Learning

Learning Path for Machine Learning

Deep learning II - II Optimization algorithms - Mini-batch gradient descent

Deep learning II - II Optimization algorithms - Gradient descent with momentum 动量梯度下降算法

1.2.9&1.2.10 【Deep Learning翻译系列】Logistic Regression Gradient Descent 对数几率回归的梯度下降

Gradient descent

Machine learning/Deep Learning Resources

Machine Learning Overview

Neural Networks for Machine Learning

Stanford University --- Machine Learning

Tutorials on topics in machine learning

machine learning相关会议

Azure Machine Learning

Statistical Methods for Machine Learning

[Machine Learning] Linear regression

Python Machine Learning

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)