机器学习之交叉验证和网格搜索 - 代码天地

机器学习之交叉验证和网格搜索

其他 2019-11-16 11:34:07 阅读次数: 0

交叉验证

将拿到的训练数据，分为训练集和验证机。以下图为例：将训练数据分为4份，其中一份作为验证集，。然后经过5次的测试，每次都更换不同的验证机，

最后得到5组模型的结果。最后取平均值作为最后的结果。这也称为4折交叉验证。

网格搜索（超参数搜索）:

通常情况下，有很多参数是需要手动指定的（如K-近邻算法中的K值），这种教超参数。但是手动过程繁杂，所提需要对模型预设几种超参数组合。每组超参数都采用交叉验证来进行评估。最后选出最优参数组合建立模型。

作用：调参数。

API：sklearn.model_selection.GridSearchCV

以K-近邻那篇文章的例子进行修改，代码如下：

 1 from sklearn.model_selection import GridSearchCV
 2 from sklearn.datasets import load_iris
 3 from sklearn.model_selection import train_test_split
 4 from sklearn.preprocessing import StandardScaler
 5 from sklearn.neighbors import KNeighborsClassifier
 6 
 7 def knn():
 8     """
 9     鸢尾花分类
10     :return: None
11     """
12 
13     # 数据集获取和分割
14     lr = load_iris()
15 
16     #标准化
17     std = StandardScaler()
18     x = std.fit_transform(lr.data)
19 
20     x_train, x_test, y_train, y_test = train_test_split(x, lr.target, test_size=0.25)
21 
22     # estimator流程
23     knn = KNeighborsClassifier()
24 
25     #构造一些参数的值进行搜索
26     param = {'n_neighbors': [3,5,10]}
27 
28     #j进行网格搜索
29     gc = GridSearchCV(knn,param_grid = param, cv = 10)
30 
31     gc.fit(x_train,y_train)
32 
33     #预测准确率
34     print('再测试集上的准确率：',gc.score(x_test,y_test))
35     print('再交叉验证中最好的结果：',gc.best_score_)
36     print('选择的最好的模型是:',gc.best_estimator_)
37     print('每个超参数每次交叉验证的结果',gc.cv_results_)
38 
39     return None
40 
41 if __name__ == "__main__":
42     knn()

可以看到结果，在K=10的时候，10折交叉验证的结果最好，准确率达到了95.5%。比单用K-邻近法的94%稍微高一些。

猜你喜欢

转载自www.cnblogs.com/GouQ/p/11871070.html

机器学习之交叉验证和网格搜索

机器学习系列之交叉验证、网格搜索

sklearn库之交叉验证与网格搜索

机器学习与深度学习：网格搜索和交叉验证

机器学习代码实战——网格搜索和交叉验证（GridSearchCV）

机器学习-交叉验证和网格搜索(带案例)

交叉验证和网格搜索

Python机器学习之交叉验证

机器学习笔记之交叉验证

机器学习之交叉验证(Cross Validation)

通过网格搜索和嵌套交叉验证寻找机器学习模型的最优参数

网格搜索和随机搜索调优超参数&&嵌套交叉验证选择机器学习算法

网格搜索与交叉验证

交叉验证与网格搜索

关于网格搜索和交叉验证

机器学习(十二)-机器学习两大法宝交叉验证与网格搜索

机器学习模型选择与调优 ---交叉验证、超参数搜索-网格搜索

机器学习基础知识之交叉验证

Titannic学习之交叉验证

学习笔记（七）模型的调参之网格搜索和交叉验证的简单应用

交叉验证和网格搜索 GridSearchCV / cross_val_score

python学习11之交叉验证

【机器学习】几个常用分类模型实战（数据预处理+K折交叉验证+AUC模型评估+网格搜索）

【机器学习】交叉验证(Cross Validation)与网格交叉验证(GridSearchCV)的区别

机器学习实践（八）—sklearn之交叉验证与参数调优

2021大三机器学习之交叉验证课程基础总结

Libsvm交叉验证与网格搜索（参数选择）

机器学习——超参数和网格搜索

机器学习- Sklearn (交叉验证和Pipeline)

机器学习交叉验证

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)