数据集划分

编程语言 2018-08-12 00:39:56 阅读次数: 0

1.使用sklearn.model_selection.train_test_split(*arrays, **options)

*arrays指定需划分数据集
random_state指定随机种子
test_size指定测试集大小

train_data,test_data = train_test_split(processed_data,random_state=1,test_size = 0.1)

sklearn文档
2.使用Numpy.random.choice(a, size=None, replace=True, p=None)

a为可采样的样本
size为输出数据格式
replace为True，则可以出现重复采样点；False，则不可以出现重复采样点
P为采样概率分布，默认为均匀分布

sample = np.random.choice(processed_data.index,size = int(len(processed_data)*0.9),replace = False)
train_data,test_data = processed_data.iloc[sample],processed_data.drop(sample)

Numpy文档

猜你喜欢

转载自blog.csdn.net/pismirecc/article/details/81483594

数据集划分问题

划分数据集

数据集划分

sklearn数据集划分

数据集划分处理

sklearn-数据集划分

sklearn中数据集划分

sklearn 划分数据集

机器学习数据集的划分

pytorch划分数据集

数据集划分：交叉验证

数据集的划分与交叉验证

如何划分数据集

随机划分数据集

机器学习之数据集划分——训练集测试集划分，划分函数，估计器的使用

数据处理——数据集划分

数据集的训练集和测试集划分

如何把数据集划分成训练集和测试集

机器学习数据集（训练集、测试集）划分方法

目标检测数据集划分训练集和验证集

将数据集划分为训练集和测试集

StratifiedShuffleSplit（）函数实现对数据集的划分

交叉验证——对数据集的划分

深度学习数据集的正确划分

深度学习中的数据集划分

Python Sklearn数据集划分函数StratifiedShuffleSplit

决策树划分数据集

机器学习之划分数据集

划分数据集导入keras

Pytorch划分数据集的方法

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)