梯度下降中的学习率的作用

如图所示:

 如果不用学习率或者说学习率为1,使用负梯度,即最速下降法,永远无法下降到最优值即0点处;作一次梯度下降,就移动相对称的点上;来来回回走;

猜你喜欢

转载自blog.csdn.net/ningyanggege/article/details/85093103