CS231N——图像分类(课时4)

图像分类概念:输入图片,判断是什么类别(已有类别集合)
图像分类难点
这里写图片描述

数据驱动类算法思路
1)准备数据:从搜索引擎爬取大量需要的数据,进行数据清洗,标注。
2)选择算法。
3)训练。
4)测试。

KNN(k近邻)
数据集CIFAR-10http://www.cs.toronto.edu/~kriz/cifar.html
60000张32X32的小图像。每张图像都有10种分类标签(飞机,汽车,轮船,卡车,鸟,猫,狗,鹿,青蛙,马)中的一种。训练集:50000张,测试集:10000张。
算法:训练 O(1)测试则是O(n),和实际需求相反

数据集(训练集,验证集,测试集)
超参数(hyper parameter)选择,可能会尝试不同的值,通过多次训练,取得验证集上最佳的效果

测试集只在最后用
一般训练数据分作,验证集和训练集两部分,使用验证集对所有超参数调优,最后只在测试集上跑一次报告结果。

交叉验证:当训练数据太少 将数据分作5份,只取其中的一份作为验证,然后循环取4份进行训练。然后取5次验证结果的平均值作为算法的验证结果

猜你喜欢

转载自blog.csdn.net/sangky/article/details/80555435