对比不同学习率对模型结果的影响

一起养成写作习惯！这是我参与「掘金日新计划 · 4 月更文挑战」的第4天，点击查看活动详情。

前言

在这里我们为了保障实验具备可比性，我们采用控制变量法进行比较lr=0.1、lr=0.01、lr=0.001和lr=0.0001对图像分类的影响，为了简便实验，我们采用LeNet-5网络结构做母版这样大家也都熟悉，同样我们的数据集也为同一个。
其中LeNet-5网络结构详细介绍大家可参考网上亦可参考：juejin.cn/post/707478… 鉴于我在上一篇博客中三种卷积核训练的结果不是很满意，在不改变卷积结构的情况下，选择卷积核大小为3乘3的作为实验对象。（上篇博客地址：juejin.cn/post/708236…

一.比对之前

明确不变量如下所示：
1.1 数据集不变（总类别为10，手写数字数据集，单类别数为500）
1.2 训练集和验证集的划分不变（训练：验证=7：3）
1.3 网络结构除卷积核相同
1.4 训练轮数相同
1.5 损失函数相同
1.6 验证频率
1.7 硬件设备相同
为了避免意外现象，我们对这5种学习率各自进行三次训练，分别取均值为最后统计值

options = trainingOptions('sgdm',...
    'InitialLearnRate',0.01, ...
    'maxEpochs', 20, ...
    'ValidationData', imdsValidation, ...
    'ValidationFrequency',5,...
    'Verbose',false,...
    'Plots','training-progress');% 显示训练进度
复制代码