sklearn数据集随机切分（train_test_split） - 代码天地

sklearn数据集随机切分（train_test_split）

其他 2018-10-30 21:42:53 阅读次数: 0

版权声明：本文为博主 http://blog.csdn.net/churximi 原创文章，未经允许不得转载，谢谢。 https://blog.csdn.net/churximi/article/details/61415254

sklearn学习

给定数据集X和类别标签y，将数据集按一定比例随机切分为训练集和测试集。

代码

#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""
功能：数据集按比例切分为训练集和测试集
时间：2017年3月11日 12:48:57
"""

# from sklearn.cross_validation import train_test_split
from sklearn.model_selection import train_test_split  # 更新

# 生成200个句子，前100个和后100个类别分别对应1和2
X = [[u"这是", u"第1个", u"测试"]] * 100 + [[u"这是", u"第2个", u"测试"]] * 100
y = [1] * 100 + [2] * 100

# 随机抽取20%的测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
print len(X_train), len(X_test)

# 查看句子和标签是否仍然对应
for i in range(len(X_test)):
    print "".join(X_test[i]), y_test[i]

if __name__ == "__main__":
    pass

实验结果

切分后的训练集和测试集标签仍然一一对应。

这里写图片描述

更新

2017年08月26日
由于sklearn更新，代码应改为：
from sklearn.model_selection import train_test_split

猜你喜欢

转载自blog.csdn.net/churximi/article/details/61415254

sklearn数据集随机切分（train_test_split）

train_test_split数据切分

sklearn的train_test_split

sklearn——train_test_split 随机划分训练集和测试集

sklearn中train_test_split详解（数据集划分为训练集与测试集）

scikit-learn用train_test_split随机划分数据集和训练集

sklearn学习：train_test_split

关于sklearn中train_test_split

sklearn的train_test_split函数

Sklearn的train_test_split用法

Sklearn train_test_split参数详解

train_test_split

纯随机采样(train_test_split)和分层采样(StratifiedShuffleSplit)| sklearn库实现

【自用】 sklearn 用 train_test_split 简单划分训练和测试集

sklearn的train_test_split的random_state

机器学习sklearn中的train_test_split()函数

sklearn的train_test_split函数的random_state

deep_learning_Function_sklearn的train_test_split()

1)sklearn学习之train_test_split

sklearn中train_test_split()函数用法

sklearn.model_selection中train_test_split的坑

08_sklearn数据集，数据集划分train_test_split，sklearn.datasets及其api，sklearn分类数据集，sklearn回归数据集，转换器与预估器

from sklearn.cross_validation import train_test_split，train_test_split下出现红色波浪线

train_test_split函数

关于train_test_split

笔记——Train_test_split

train_test_split 分割测试集训练集

数据集划分——train_test_split函数使用说明

Sklearn-train_test_split随机划分训练集和测试集

sklearn.model_selection.train_test_split随机划分训练集和测试集

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)