交叉验证 python - 代码天地

交叉验证 python

其他 2018-07-11 18:05:08 阅读次数: 0

以下简称交叉验证(Cross Validation)为CV.CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set),首先用训练集对分类器进行训练,在利用验证集来测试训练得到的模型(model),以此来做为评价分类器的性能指标.常见CV的方法如下:
K次交叉检验（K-Fold Cross Validation）：
K次交叉检验的大致思想是将数据大致分为K个子样本，每次取一个样本作为验证数据，取余下的K-1个样本作为训练数据

from sklearn.model_selection import KFold
import numpy as np
X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
y = np.array([1, 2, 3, 4])
kf = KFold(n_splits=2)

for train_index, test_index in kf.split(X):
    print("TRAIN:", train_index, "TEST:", test_index)
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]

Stratified k-fold：
StratifiedKFold()这个函数较常用，比KFold的优势在于将k折数据按照百分比划分数据集，每个类别百分比在训练集和测试集中都是一样，这样能保证不会有某个类别的数据在训练集中而测试集中没有这种情况，同样不会在训练集中没有全在测试集中，这样会导致结果糟糕透顶。

from sklearn.model_selection import StratifiedKFold
import numpy as np

X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
y = np.array([0, 0, 1, 1])
skf = StratifiedKFold(n_splits=2)
for train_index, test_index in skf.split(X, y):
    print("TRAIN:", train_index, "TEST:", test_index)
    X_train, X_test = X[train_index], X[test_index]
    y_train, y_test = y[train_index], y[test_index]

train_test_split:(这个目前用的比较多）

随机根据比例分配训练集和测试集。这个函数可以调整随机种子。

import numpy as np
from sklearn.model_selection import train_test_split
X, y = np.arange(10).reshape((5, 2)), range(5)

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.33, random_state=42)

参考：https://blog.csdn.net/ztchun/article/details/71169530

猜你喜欢

转载自blog.csdn.net/qq_26645205/article/details/78860731

交叉验证 python

Python机器学习之交叉验证

python学习11之交叉验证

Python实现K折交叉验证

python机器学习交叉验证实例

机器学习-交叉验证 : python数据集划分

【机器学习】交叉验证、正则化实例Python代码实现

【Python实例第1讲】交叉验证预测曲线的画法

[机器学习] K折交叉验证/hold out python实现

机器学习：交叉验证和模型选择与Python代码实现

Python数据分析分类算法交叉验证实现

Python每日一记21>>>交叉验证

python 划分训练集——K折交叉验证

python机器学习（2）训练、交叉验证、测试

【Python学习】 - sklearn学习 - 交叉验证中的常用函数

人脸识别K-折交叉验证的python实现

Python数据分析与挖掘——交叉验证法

时序数据交叉验证方法与python实现

交叉熵以及通过Python实现softmax_交叉熵（tensorflow验证）

交叉验证

交叉验证等验证方法

k-fold cross validation（k-折叠交叉验证）,python pandas （ix & iloc &loc）的区别

CS231n-assignment1 K-fold 交叉验证 python 中字典的用法

K折交叉验证--小轮子转呀转（Python实现）

Python3入门机器学习 - GridSearch探索最佳超参数与交叉验证

python机器学习——十次交叉验证训练的数据准备算法

机器学习基础：(Python)训练集测试集分割与交叉验证

【寻优算法】交叉验证（Cross Validation）参数寻优的python实现：多参数寻优

python交叉验证以及将全部数据分类训练集和测试集（分类）

Python scikit-learn，交叉验证，网格搜索，GridSearchCV，自动调参调优

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)