python 划分训练集——K折交叉验证 - 代码天地

python 划分训练集——K折交叉验证

其他 2020-02-20 20:33:15 阅读次数: 0

首先来生成一个训练集

import pandas as pd
import numpy as np
from sklearn.model_selection import StratifiedKFold

filename_label = {'filename':[str(i)+'.jpg' for i in range(100)], 'label':[np.random.randint(0,5) for i in range(100)]}
train = pd.DataFrame(filename_label)

print(train['label'].value_counts())
'''
2    23
1    23
0    20
4    18
3    16
Name: label, dtype: int64
'''
train.head(10)

在这里插入图片描述

接下来使用 sklearn.model_selection.StratifiedKFold，把这个 CSV 文件分成 2K 个文件，即 K 个训练集加 K 个测试集：

n_splits = 5  # K
x = train['filename'].values
y = train['label'].values
skf = StratifiedKFold(n_splits=n_splits, random_state=42, shuffle=True)

for index,(train_index,test_index) in enumerate(skf.split(x,y), start=1):
    res_train = pd.DataFrame()
    res_train['filename'] = train['filename'].iloc[train_index]
    res_train['label'] = train['label'].iloc[train_index]
    res_train.to_csv("train_{}.csv".format(index),index=False)

    res_train = pd.DataFrame()
    res_train['filename'] = train['filename'].iloc[test_index]
    res_train['label'] = train['label'].iloc[test_index]
    res_train.to_csv("test_{}.csv".format(index),index=False)

在这里插入图片描述
因为是 5 折交叉验证，所以训练集和测试集的行数之比为 4:1

颹蕭蕭

发布了274 篇原创文章 · 获赞 446 · 访问量 42万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/itnerd/article/details/104307606

python 划分训练集——K折交叉验证

【Python学习】 - sklearn学习 - 数据集分割方法 - 随机划分与K折交叉划分与StratifiedKFold与StratifiedShuffleSplit

Python实现K折交叉验证

[机器学习] K折交叉验证/hold out python实现

人脸识别K-折交叉验证的python实现

python 机器学习划分训练集/测试集/验证集

机器学习-交叉验证 : python数据集划分

K折交叉验证--小轮子转呀转（Python实现）

python-K折交叉验证、KFold和StratifiedKFold的区别、random_state（随机状态）

python机器学习库sklearn——交叉验证（K折、留一、留p、随机）

python实现对于数据集的划分（随机划分出训练集和验证集）

留出法、K折交叉验证、留一法进行数据集划分

k折交叉验证

Python将样本划分为训练集/验证集/测试集

机器学习基础：(Python)训练集测试集分割与交叉验证

python交叉验证以及将全部数据分类训练集和测试集（分类）

python划分训练集和测试集

用MNIST数据集实现K-折交叉验证

K折交叉验证学习

Cross-validation 交叉验证与训练集测试集划分

五折交叉验证/K折交叉验证

【深度学习】使用python划分数据集为训练集和验证集和测试集并放在不同的文件夹(转载)

数据集划分：交叉验证

数据集的划分与交叉验证

python实现划分机器学习训练集与测试集

R语言k折交叉验证

sklearn中的k折交叉验证

笔记 - 模型评估：K折交叉验证

python：使用sklearn库的KFold模块进行随机森林十折交叉验证

在Mnist数据上使用k折交叉验证训练，pytorch代码到底怎么写

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)