python之sklearn-分类算法-2.4 网格搜索、交叉验证(模型选择与调优) - 代码天地

python之sklearn-分类算法-2.4 网格搜索、交叉验证(模型选择与调优)

其他 2020-09-09 10:42:59 阅读次数: 0

一，为什么需要交叉验证

交叉验证目的：为了让被评估的模型更加准确可信

二，什么是交叉验证(cross validation)

交叉验证：将拿到的训练数据，分为训练和验证集。
以下图为例：将训练集数据分成5份，其中一份作为验证集。然后经过5次(组)的测试，每次都更换不同的验证集。即得到5组模型的结果，取平均值作为最终结果。又称5折交叉验证。

1，分析

我们之前知道数据分为训练集和测试集，但是为了让从训练得到模型结果更加准确。做以下处理:

训练集：训练集+验证集
测试集：测试集

问题：那么这个只是对于参数得出更好的结果，那么怎么选择或者调优参数呢？

三，超参数搜索-网格搜索(Grid Search)

通常情况下，有很多参数是需要手动指定的（如k-近邻算法中的K值），这种叫超参数。 但是手动过程繁杂，所以需要对模型预设几种超参数组合。每组超参数都采用交叉验证来进行评估。最后选出最优参数组合建立模型。
在这里插入图片描述

四，模型选择与调优API

sklearn.model_selection.GridSearchCV(estimator, param_grid=None,cv=None)
- 对估计器的指定参数值进行详尽搜索
- estimator：估计器对象
- param_grid：估计器参数(dict){“n_neighbors”:[1,3,5]}
- cv：指定几折交叉验证
- fit：输入训练数据
- score：准确率
- 结果分析：
  - bestscore:在交叉验证中验证的最好结果_
  - bestestimator：最好的参数模型
  - cvresults:每次交叉验证后的验证集准确率结果和训练集准确率结果

五，Facebook签到位置预测K值调优

使用网格搜索估计器

# 使用网格搜索和交叉验证找到合适的参数
knn = KNeighborsClassifier()

param = {"n_neighbors": [3, 5, 10]}

gc = GridSearchCV(knn, param_grid=param, cv=2)

gc.fit(x_train, y_train)

print("选择了某个模型测试集当中预测的准确率为：", gc.score(x_test, y_test))

# 训练验证集的结果
print("在交叉验证当中验证的最好结果：", gc.best_score_)
print("gc选择了的模型K值是：", gc.best_estimator_)
print("每次交叉验证的结果为：", gc.cv_results_)

猜你喜欢

转载自blog.csdn.net/TFATS/article/details/108218166

python之sklearn-分类算法-2.4 网格搜索、交叉验证(模型选择与调优)

11_模型的选择与调优,交叉验证,超参数搜索-网格搜索sklearn.model_selection.GridSearchCV

python之sklearn-分类算法-3.5 模型的保存与加载

网格搜索和随机搜索调优超参数&&嵌套交叉验证选择机器学习算法

简单粗暴理解与实现机器学习之K-近邻算法（十）：交叉验证，网格搜索（模型选择与调优）API、鸢尾花案例增加K值调优

简单粗暴理解与实现机器学习之K-近邻算法（十）：交叉验证，网格搜索（模型选择与调优）API、鸢尾花案例增加K值调优

Python scikit-learn，交叉验证，网格搜索，GridSearchCV，自动调参调优

【机器学习】分类算法 - 模型选择与调优GridSearchCV（网格搜索）

学习笔记（七）模型的调参之网格搜索和交叉验证的简单应用

机器学习模型选择与调优 ---交叉验证、超参数搜索-网格搜索

模型选择与调优，交叉验证与网格的搜索相结合总结

python之sklearn-特征工程-1.4 特征选择

sklearn-交叉验证

sklearn库之交叉验证与网格搜索

python之sklearn-分类算法-3.1 线性回归

python之sklearn-分类算法-2.7 随机森林

python之sklearn-分类算法-2.6 决策树

Python实现AdaBoost回归模型(AdaBoostRegressor算法)并应用网格搜索算法调优项目实战

模型调参-网格搜索Sklearn应用

分类算法-模型选择与调优

python之sklearn- 分类算法-2.2 sklearn转换器和估计器

【机器学习】几个常用分类模型实战（数据预处理+K折交叉验证+AUC模型评估+网格搜索）

sklearn的GridSearchCV——网格搜索超参数调优

python之sklearn-分类算法-3.4 逻辑回归与二分类

python之sklearn-分类算法-2.3 K-近邻算法

K折交叉验证与网格搜索算法（scikit learn）

python之sklearn-分类算法-3.3 线性回归的改进-岭回归

python之sklearn-分类算法-3.2 欠拟合与过拟合

python之sklearn- 分类算法-2.1 数据集介绍与划分

sklearn-模型评价

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)