网格搜索与交叉验证 - 代码天地

网格搜索与交叉验证

其他 2020-01-19 16:30:19 阅读次数: 0

网格搜索算法是一种通过遍历给定的参数组合来优化模型表现的方法。

以决策树为例，当我们确定了要使用决策树算法的时候，为了能够更好地拟合和预测，我们需要调整它的参数。在决策树算法中，我们通常选择的参数是决策树的最大深度。于是我们会给出一系列的最大深度的值，比如 {'max_depth': [1,2,3,4,5]}，我们会尽可能包含最优的最大深度。不过如何评价哪一个最大深度的模型是最好的呢？我们需要一种可靠的评分方法，对每个最大深度的决策树模型都进行评分，这其中非常经典的一种算法就是交叉验证。

我们以K折交叉验证为例，详细介绍它的算法过程：

首先将原始数据集按照一定比例划分为训练集和测试集

训练集用来训练我们的模型。测试集用来评估我们训练好的模型表现如何。

在K折交叉验证中，我们用到的数据是训练集中的所有数据。我们将训练集的所有数据平均划分为K份，取第K份作为验证集，余下的K-1份作为交叉验证的训练集。

对于我们最开始选择的决策树的5个最大深度，以max_depth=1为例，我们先用第2-10份数据作为训练集的训练模型，用第一份数据作为验证集对这次训练的模型进行评分，得到第一个分数。然后重新构建一个max_depth=1的决策树。用第1和3-10份数据作为训练集训练模型，用第2份数据作为验证集对这次训练的模型进行评分，得到第二个分数，以此类推，得到第十个分数。于是对于max_depth=1的决策树模型，我们训练了10次，验证了10次，得到了10个验证分数。然后计算这10个验证分数的平均分数，就是max_depth=1的决策树模型的最终验证分数。

对于max_depth = 2,3,4,5时，分别进行和max_depth=1相同的交叉验证过程，得到他们的最终验证分数，然后我们就可以对这5个最大深度的决策树的最终验证分数进行比较，分数最高的那一个就是最优的最大深度。我们利用最优参数在全部训练集上训练一个新的模型，整个模型就是最优模型。

赤o兮

发布了28 篇原创文章 · 获赞 9 · 访问量 4658

私信关注

猜你喜欢

转载自blog.csdn.net/chixi123/article/details/103958126

网格搜索与交叉验证

交叉验证与网格搜索

交叉验证和网格搜索

关于网格搜索和交叉验证

sklearn库之交叉验证与网格搜索

Libsvm交叉验证与网格搜索（参数选择）

机器学习系列之交叉验证、网格搜索

K折交叉验证与网格搜索算法（scikit learn）

机器学习之交叉验证和网格搜索

机器学习与深度学习：网格搜索和交叉验证

机器学习代码实战——网格搜索和交叉验证（GridSearchCV）

机器学习-交叉验证和网格搜索(带案例)

交叉验证和网格搜索 GridSearchCV / cross_val_score

机器学习模型选择与调优 ---交叉验证、超参数搜索-网格搜索

通过网格搜索和嵌套交叉验证寻找机器学习模型的最优参数

学习笔记（七）模型的调参之网格搜索和交叉验证的简单应用

客户逾期贷款预测[6] - 网格搜索调参和交叉验证

构建网格搜索+交叉验证（lr模型）（某金融数据集）

Python scikit-learn，交叉验证，网格搜索，GridSearchCV，自动调参调优

机器学习(十二)-机器学习两大法宝交叉验证与网格搜索

python之sklearn-分类算法-2.4 网格搜索、交叉验证(模型选择与调优)

交叉验证与网格搜索（以KNN分类鸢尾花为例）

模型选择与调优，交叉验证与网格的搜索相结合总结

交叉验证及并行搜索

交叉验证(Cross Validation)与网格交叉验证(GridSearchCV)的区别

网格搜索和随机搜索调优超参数&&嵌套交叉验证选择机器学习算法

11_模型的选择与调优,交叉验证,超参数搜索-网格搜索sklearn.model_selection.GridSearchCV

【机器学习】几个常用分类模型实战（数据预处理+K折交叉验证+AUC模型评估+网格搜索）

【机器学习】交叉验证(Cross Validation)与网格交叉验证(GridSearchCV)的区别

数据分割：留出法train_test_split、留一法LeaveOneOut、GridSearchCV(交叉验证法+网格搜索)、自助法

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)