cross-validation

交叉验证

  • 模型拟合的程度好坏取决于数据的划分(主要指训练集和测试集的划分)-
  • 不代表模型的泛化能力datacamp

    Cross-validation is a vital step in evaluating a model. It maximizes the amount of data that is used to train the model, as during the course of training, the model is not only trained, but also tested on all of the available data.
    最大化的选择模型分训练集,使其泛化能力更好

    基本思想

    交叉验证的基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set or test set),首先用训练集对分类器进行训练,再利用验证集来测试训练得到的模型(model),以此来做为评价分类器的性能指标。百度百科

用途

  • 准确的调整模型的超参数(Hyperparameter),且这组参数对不同的数据,表现相对稳定
  • 在某些分类场景,你可以同时使用逻辑回归、决策树或聚类等多种算法建模,当不确定哪种算法效果更好时,可以使用交叉验证

猜你喜欢

转载自www.cnblogs.com/gaowenxingxing/p/12302890.html
今日推荐