版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xd15010130025/article/details/88756945
文章目录
1.提出问题
和 起到的作用以及更新函数为什么是有效的?
2.简化
我们再次将 简化为 ,由之前的知识我们可以得到, 函数是一个二次函数。如下图。
3.导数部分的工作原理
因为
是正数,在右边的时候导数是大于零的,所以
是在变小的;同理,在左边的时候导数是小于零的,所以
是在变大的;即
的变化方向是对的,这就是
起到的作用。
4.学习因子 起到的作用
4.1决定收敛的快慢
如果
太小,那么梯度下降的就比较慢,如果
太大,梯度下降可能会越过最小点,甚至发散开来
4.2在局部最优点的情况
在局部最优点时,
更新后和原来的值一样,和我们期望的结果一致。
4.3梯度下降能聚焦到局部最优解,即使 不变
因为随着慢慢的靠近最低点,
会慢慢的变小,收敛速度会自己慢慢地变慢。如下图所示,每一次更加接近最优解,
会变小,收敛的速度会变慢