cross_validation.train_test_split - 代码天地

cross_validation.train_test_split

编程语言 2018-05-24 05:02:26 阅读次数: 4

在机器学习中，该函数可按照用户设定的比例，随机将样本集合划分为训练集和测试集，并返回划分好的训练集和测试集数据。

语法

X_train,X_test, y_train, y_test =cross_validation.train_test_split(X,y,test_size, random_state)

1

参数说明

Code	Text
X	待划分的样本特征集合
y	待划分的样本标签
test_size	若在0~1之间，为测试集样本数目与原始样本数目之比；若为整数，则是测试集样本的数目。
random_state	随机数种子
X_train	划分出的训练集数据（返回值）
X_test	划分出的测试集数据（返回值）
y_train	划分出的训练集标签（返回值）
y_test	划分出的测试集标签（返回值）

代码示例
输入：

import numpy as np
from sklearn.model_selection import train_test_split

#创建一个数据集X和相应的标签y,X中样本数目为100
X, y = np.arange(200).reshape((100, 2)), range(100)

#用train_test_split函数划分出训练集和测试集，测试集占比0.33
X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.33, random_state=42)

#打印出原始样本集、训练集和测试集的数目
print("The length of original data X is:", X.shape[0])
print("The length of train Data is:", X_train.shape[0])
print("The length of test Data is:", X_test.shape[0])

1
2
3
4
5
6
7
8
9
10
11
12
13
14

输出：

The length of original data X is: 100
The length of train Data is: 67
The length of test Data is: 33

猜你喜欢

转载自blog.csdn.net/qq_30868235/article/details/80369686

cross_validation.train_test_split

Python笔记——cross_validation模块、train_test_split

sklearn.cross_validation.train_test_split用法

from sklearn.cross_validation import train_test_split，train_test_split下出现红色波浪线

sklearn中从sklearn.cross_validation 导入 train_test_split报错No module named ‘sklearn.cross_validation‘

Python sklearn.cross_validation.train_test_split及混淆矩阵实现

机器学习中 from sklearn.cross_validation import train_test_split出错

导入train_test_split时，ModuleNotFoundError: No module named 'sklearn.cross_validation'

导入train_test_split时，ModuleNotFoundError: No module named 'sklearn.cross_validation'

from sklearn.cross_validation import train_test_split 报错

Train, Validation and Test Sets

train_test_split

sklearn的train_test_split

train_test_split函数

关于train_test_split

笔记——Train_test_split

sklearn之Cross-validation、GridSearchCV，以及训练集（train）、测试集（test）、验证集（validate）的辨析

sklearn中的train_test_split（数据分割）、preprocessing（归一化）、cross_val_score（交叉验证）

Train/Test/Validation Set Splitting in Sklearn

sklearn学习：train_test_split

train_test_split----random_state

关于sklearn中train_test_split

sklearn的train_test_split函数

python中的train_test_split方法

sklearn.model_selection.train_test_split

Sklearn的train_test_split用法

python中train_test_split()

train_test_split 参数详解

train_test_split用法总结

Sklearn train_test_split参数详解

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

事务隔离级及脏读、幻读和不可重复读

rtos：zephyr同步信号量

把对象转换为JSON格式的数据

iOS Dev (56) iTunes Store 销售日报更新时间

Failed to start mongod.service: Unit not found;mongodb in unbuntu

Upgrading PHP on CentOS 6.5 (Final)

（四）王道机试指南___排版问题

TensorFlow之手写体识别

xcode xib报错 Safe Area Layout Guide Before IOS 9.0

【LeetCode】76. Minimum Window Substring（C++）

每日归档

更多

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)