关于BP算法和梯度下降 - 代码天地

关于BP算法和梯度下降

其他 2019-04-22 13:31:27 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Bazingaea/article/details/84181973

最开始学习神经网络，感触最深的就是BP算法，当时只用到却没有好好体会它背后的深意，在RNN中也会用到一个类似的算法（BPTT下面会具体讲）。对神经网络有些了解，就会熟悉BP算法由两个部分组成，向前传播和反向传播。

向前传播从输入层经过隐藏层到输出层，给出预测结果，在第一次传输过程中，使用到的权重（或者说参数）都是最开始随机初始化的，可想而知这样随机初始化的权重，最后得到的结果，与真实值的误差一定是很大的。

那么神经网络要做的一件事其实就是得到与真实值相近甚至一样的预测值，那么就把问题指向了如何修正这些权重值，才能使得预测值接近真实值。这就有了代价函数，计算真实值和预测值之间的误差，以这个误差为基准，进行BP的第二个部分，反向传播。这个过程的核心就是梯度下降法，求每个权重对应误差的偏导数值，以此作为修正权重的依据。不知道大家有没有思考过，为什么反向传播要求L对W的导数呢？（L值代价，W是权重）

反向传播的意义是，修正权重并且缩小cost值，权重更新公式是 W = W - Learning_rate * dw

求导就保证了，参数的更新是朝着正确的方向，也就是使cost缩小的方向进行的，

这个图是过于简单了，但只是为了说明问题，就不用计较这些细节了。图一如果cost函数随w的变化趋势是向上的，在某个值对w求导得到的导数是正值，为了使L减少，W也需要减少，那么W = W-learning_rate*dw 就是减少W的值，可以达到效果

如果cost函数随着w的变化趋势是向下的，那么他的导数是负值，为了让L减少，W反而要增大，W = W-learning_rate*dw ，减去一个负值就等于增加一个正值，w增大了，也可以达到效果。

注意learning_rate一定是正的。

猜你喜欢

转载自blog.csdn.net/Bazingaea/article/details/84181973

关于BP算法和梯度下降

关于梯度下降算法

BP算法（Back Propagation）与梯度下降法

深度学习基础--BP和训练--常用的梯度下降

关于梯度下降优化算法的概述

梯度下降：全梯度下降算法(FG)、随机梯度下降算法(SG)、小批量梯度下降算法(mini-batch)、随机平均梯度下降算法(SAG)。梯度下降法算法比较和进一步优化。

关于梯度下降

关于梯度下降法

关于梯度下降的理解

BP网络中反向传播过程梯度下降算法的学习心得

[ML] 梯度下降算法

梯度下降算法

梯度下降算法小结

梯度下降与EM算法

梯度下降（上升）算法

梯度下降算法总结

优化算法—梯度下降

梯度下降优化算法

梯度下降/上升算法

梯度下降及优化算法

梯度下降算法推导

梯度下降算法及改进

二、梯度下降算法

梯度下降的优化算法

【梯度下降算法】

梯度下降算法实战

详解梯度下降算法

监督学习——随机梯度下降算法（sgd）和批梯度下降算法（bgd）

梯度下降、随机梯度下降和批量梯度下降

批量梯度下降和随机梯度下降

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)