深度学习中的基本概念

1. 梯度裁剪:当梯度大于一定阈值的时候才对其裁剪

caffe的solver中设置

clip_gradients: 10 #float

2. 梯度爆炸:深度网络的反传过程中,是一个梯度权值连成的过程,这样如果因子值大于1,则随着层数增加乘积会越来越大

3. 梯度消失:当因子小于1时,乘积则会越来越小接近于0,使得无法更新网络参数

猜你喜欢

转载自www.cnblogs.com/haiyang21/p/10819218.html
今日推荐