1. 实战 Kaggle 比赛:图像分类(CIFAR-10)
https://www.kaggle.com/c/cifar-10
2. Q&A
-
- 凸函数表示有最优解。损失函数是个凸函数,但是神经网络大多数都是非凸的,一般神经网络是没有最优解的。
-
- momentum表示把曲线变得平滑一点。
-
- Scheduler 前期选择的学习率大一点,后期学习率变小一点。类似年轻的时候多出去看看。
-
- sgd 相当于做了regular的作用,所以sgd比别的算法好一点。
参考
https://www.bilibili.com/video/BV1Gy4y1M7Cu?p=1