深度学习笔记-训练集,验证集,测试集

  • 验证集是为了验证哪个算法更加高效,选出最好的模型;
  • 测试集是为了正确评估模型的性能,
  • 在数据量很小的情况下,可以按照60/20/20的比例为训练集,验证集,测试集进行分配
  • 在数据量很大的情况下,如百万数据时,比例分配会发生变化,dev和test各给10000个数据就可以,因为验证哪个算法好,顶多不超过10个算法,并且希望尽快验证出好坏,不宜过多数据
  • dev set 和 test set 一定要是从同一分布中的得来的数据

猜你喜欢

转载自blog.csdn.net/disasters/article/details/84554853