文章目录
- 写在前面
-
- 标准
- 提示:
-
- 实验记录:
- 1. Sample code
- 2. 数据归一化,添加了BN,大的batch_size由64改为128,修改激活函数为Relu,添加plot_learning_curve工具看loss曲线,
- 3. (overfitting)make model simpler(直接去掉第三层全连接层)
- 4. batch_size直接改为512
- 5. lr = 0.001(默认参数)
- 6. 修改model->256, batch_size修改为1024![在这里插入图片描述](https://img-blog.csdnimg.cn/a08aa01a2f454758a4ce428f8e1f3614.png?x-oss-process=image/watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBASSJsbCAgY2FycnkgIHlvdQ==,size_20,color_FFFFFF,t_70,g_se,x_16)
- 7. 网络从1024->256
- 8. 512->128
写在前面
标准
提示:
实验记录:
1. Sample code
2. 数据归一化,添加了BN,大的batch_size由64改为128,修改激活函数为Relu,添加plot_learning_curve工具看loss曲线,
早停策略【hw1】不错,这里没加
3. (overfitting)make model simpler(直接去掉第三层全连接层)