cs231n笔记:训练过程中的数据集和参数

训练过程中数据和其意义

训练过程中的三种数据:
1.(训练集)trainning set
2.(验证集)validation set
3 (测试集)test set
两类参数:
1.权重(weight)和偏移(baise)
2.超参数(学习率,衰退率,正则化强度等)

下面是谈谈我认识到的这三类数据和两类参数之间的关系:

1.训练集(train set)

训练集是最基本的数据,它的作用就是在不断迭代的过程中优化权重和偏移参数。通常用loss来表示在训练集上进行类别预测与其真实类别的不符合程度。loss越大,则表示不符合程度越高。loss 是weight,baise和trainning set的函数。所以求得dw和db,weight和baise沿dw和db的反方向偏移,可以减小loss的大小。

2.验证集(validation set)

刚刚解释了weight和baise是通过训练集来调整优化的,那么验证集就是用来调优超参数的。超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。那么这些参数在一次训练过程中是不变的,或者仅受其他超参数的影响而改变,比如学习率会在迭代过程中乘以衰退率而不断减小。总之这些参数不受训练集的影响。而合适的超参数能够明显提高学习的性能和效果。如何得到合适的超参数呢?通过使用验证集来实现。通过预设一系列的超参数,使用每一组超参数来训练模型,再使用该模型来对验证集进行预测。选择在验证集上表现最好的一个模型的超参数作为最优参数。

3测试集(test set)

测试集就是对最终的模型进行性能测试了,测试集仅仅从使用方法上上与验证集相同,区别是测试结果用来表征模型的判断能力,验证过程用来进行超参数调优.

猜你喜欢

转载自blog.csdn.net/qq_39805337/article/details/81286843