初尝过拟合

猫狗大战数据集

这是kaggle上一个非常经典的二分类图像数据集，训练集包括25000张猫和狗的图片及其标签，测试集则是12500张未标签图片，数据下载地址https://www.kaggle.com/c/dogs-vs-cats/data。不过这个网址比较远古，无法提交自己训练的答案，可以到新的（~~虽然也不新了~~）比赛链接提交https://www.kaggle.com/c/dogs-vs-cats-redux-kernels-edition/overview
将训练数据按类别分开整理成如下结构

   |-- train 
       |-- cat
           |-- 1.jpg
           |-- 2.jpg
           |-- ...
       |-- dog
           |-- 1.jpg
           |-- 2.jpg
           |-- ...

这样就可以调用torchvision来快速生成训练集

all_data =  torchvision.datasets.ImageFolder(
    root='train',
    transform=train_transform
)
all_len = int(len(all_data))
train_len = int(0.8*all_len)
vaild_len = int(all_len-train_len)
train_data , vaild_data= torch.utils.data.random_split(all_data,[train_len,vaild_len])
train_set = torch.utils.data.DataLoader(
    train_data,
    batch_size=BTACH_SIZE,
    shuffle=True
)
vaild_set = torch.utils.data.DataLoader(
    test_data,
    batch_size=BTACH_SIZE,
    shuffle=False
)

上面偷懒对整个train里的图片分成两个分类的文件夹，没有另开一个验证集文件夹，而是使用random_split来划分，本来是没什么问题的，但就是这样埋下了锅，后面乱搞了一下就GG了，导致模型严重过拟合还浑然不知。

模型的选择

一开始直接简单粗暴来AlexNet，但是不知道什么问题，不仅跑的慢，训练了几个epoch后收敛得也慢（~~其实可能根本没有在收敛~~）
好吧那就先放放，换了一个简单的CNN，对就和上次训练MNIST那个那么简单，先训练几个epoch试下，开跑~嗯嗯嗯跑的快了许多，loss也在减少，验证集准确率也终于不是50上下了，虽然和训练集相比提高得有点慢慢
然后我调大了epoch继续训练...

锅在哪里呢？

训练到后面训练集准确率九十多，验证集也九十了，果断把测试机test跑一遍提交~~且沾沾自喜~~
然后一看得分蒙了，和全选猫的得分差不多~~因为我真的提交过~~，很明显是严重的过拟合了
锅出在哪呢，看了下代码原来是我一开始跑的时候保存了模型，然后后面跑的时候再加载继续训练。但由于多次运行main文件，而random_split是随机划分的，所以就等于我把整个训练数据都跑了个遍，再加上模型过于简单，没有加dropout等，过拟合了也不知道，还傻乎乎交了上去

DL踩坑：初尝过拟合

初尝过拟合

猫狗大战数据集

模型的选择

锅在哪里呢？

明天在重写一个AlexNet试一下吧

猜你喜欢