【机器学习一】梯度下降法

1.用SGD 的时候样本方差不能大,大的话很可能不收敛,但是BGD则一定收敛
2.SGD收敛速度快 BGD慢点 计算量大

猜你喜欢

转载自blog.csdn.net/weixin_35389463/article/details/84036309
今日推荐