【深度学习的实用层面】(一)训练,验证,测试集(Train/Dev/Test sets)

在配置训练、验证、和测试数据集的过程中做出正确的决策会更好地创建高效的神经网络,所以需要对这三个名词有一个清晰的认识。

训练集:用来训练模型

验证集:用于调整模型的超参数,验证不同算法,检验哪种算法更有效

测试集:根据最终的分类器,正确评估分类器的性能

假设这是训练数据,用一个长方形表示,通常会把这些数据划分成几部分,一部分作为训练集,一部分作为简单交叉验证集,也称之为验证集,最后一部分则作为测试集。

train

dev

test

如果数据只有100条,100条或者1万条,通常将样本集设置为70%验证集,30%测试集。也可按照60%训练集,20%验证和20%测试集来分类较为合理。

如果数据规模较大,是百万级别,验证集和测试集要小于数据总量的20%和10%。

测试集的目的是对最终所选定的神经网络系统做出无偏估计,如果不需要无偏估计可以不设置测试集。所以如果只有验证集,没有测试集,需要做的就是在训练集上训练尝试不同的模型,在验证集上评估这些模型,然后迭代并选出适用的模型

猜你喜欢

转载自www.cnblogs.com/selenaf/p/9070076.html
今日推荐