python交叉验证以及将全部数据分类训练集和测试集（分类） - 代码天地

python交叉验证以及将全部数据分类训练集和测试集（分类）

其他 2018-12-24 00:50:32 阅读次数: 0

1,将全部数据分离成训练集和测试集（之前首先先将x和y分类出来才可以）

'''
分离数据集--
test_size  :如果是整数则选出来两个测试集，如果是小数，则是选择测试集所占的百分比。
train_size ：同理，都含有默认值0.25
shuffle   ：默认为True，表示 在分离之前是否将其打乱，如果不打乱就设为False
random_state：是随机数的种子。（感觉没什么用，因此每次都填1吧）
随机数种子：其实就是该组随机数的编号，在需要重复试验的时候，保证得到一组一样的随机数。比如你每次都填1，其他参数一样的情况下你得到的随机数组是一样的。但填0或不填，每次都会不一样。
随机数的产生取决于种子，随机数和种子之间的关系遵从以下两个规则：
种子不同，产生不同的随机数；种子相同，即使实例不同也产生相同的随机数。


'''
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=4, random_state=42)

结果：

分离成train

[[8 8 1 1 6]] [[0]]

test

[[8 9 6 7 0]
[8 7 6 9 0]
[9 3 9 8 5]
[0 8 8 1 3]]

[[0]
[1]
[0]
[0]]

2，将训练集分离做交叉验证

就是将索引分离



from sklearn.cross_validation import KFold
kf = KFold(9, n_folds=3, random_state=2)

for train, test in kf:
    print(train)
    print(test)

'''
9：代表测试集的例子的个数

[3 4 5 6 7 8]
[0 1 2]
-----------------------
[0 1 2 6 7 8]
[3 4 5]
-----------------------
[0 1 2 3 4 5]
[6 7 8]

'''

for train, test in kf:
    # The predictors we're using the train the algorithm.  Note how we only take the rows in the train folds.
    train_predictors = (titanic[predictors].iloc[train,:])
    # The target we're using to train the algorithm.
    train_target = titanic["Survived"].iloc[train]
    # Training the algorithm using the predictors and target.
    alg.fit(train_predictors, train_target)
    # We can now make predictions on the test fold
    test_predictions = alg.predict(titanic[predictors].iloc[test,:])
    predictions.append(test_predictions)

猜你喜欢

转载自blog.csdn.net/weixin_42053726/article/details/84205765

python交叉验证以及将全部数据分类训练集和测试集（分类）

训练集、验证集、测试集以及交叉验证

【图像分类】实现猫狗图片的训练集和测试集的分类：python + Asirra

训练数据集和交叉验证数据集的分割方法

交叉验证与训练集、验证集、测试集

训练集、测试集、验证集与交叉验证

训练集，验证集和测试集介绍和交叉验证法介绍

将数据集划分为训练集和测试集

训练集，验证集和测试集

训练集、验证集和测试集

深度之眼Pytorch打卡（六）：将数据集切分成训练集、验证集和测试集的方法

学习笔记：使用python将数据集划分成测试集和训练集

python将数据集图片分开成训练和验证集图片

机器学习数据集----训练集、测试集以及验证集

【R语言学习笔记】 Day7 将数据划分为训练集、验证集和测试集

Cross-validation 交叉验证与训练集测试集划分

不平衡数据集分类实战：成人收入数据集分类模型训练和评估

机器学习基础：(Python)训练集测试集分割与交叉验证

机器学习中数据训练集，测试集划分与交叉验证的联系与区别（含程序）

Python将样本划分为训练集/验证集/测试集

用python将一个数据文件分为训练集和测试集

几种分类模型训练iris数据集

Fashion MNIST 数据集分类训练

pytorch——AlexNet——训练花分类数据集

AlexNet训练分类猫狗数据集

神经网络中训练数据集、验证数据集和测试数据集的区别

将SSDD数据集按比例划分训练集、验证集和测试集，并从VOC标注格式转换到COCO格式

训练集、验证集和测试集的作用和区别

一文看懂 AI 训练集、验证集、测试集（附：分割方法+交叉验证）

训练集、验证集、测试集（附：分割方法+交叉验证）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)