smooth_L1个人理解

这里写图片描述
相当于是在小于1的部分使用2范数(更smooth,且求导方便),在大于1的部分使用1范数(避免梯度爆炸,同时减少outlier的影响)

猜你喜欢

转载自blog.csdn.net/weixin_39354819/article/details/81333769