pandas打乱数据

其他 2020-01-31 13:08:22 阅读次数: 0

在机器学习中，拿到一堆训练数据，一般会我们需要先将数据打乱，使数据随机排序，然后在进行切分，需要将数据切分成训练集、交叉验证集和测试集，在监督学习中还要切分出属性集和标签集。

第一个实现方法：

最简单的方法就是采用pandas中自带的 sample这个方法。

假设df是这个DataFrame

df.sample(frac=1)
这样对可以对df进行shuffle。其中参数frac是要返回的比例，比如df中有10行数据，我只想返回其中的30%,那么frac=0.3。
有时候，我们可能需要打混后数据集的index（索引）还是按照正常的排序。我们只需要这样操作

df.sample(frac=1).reset_index(drop=True)

切割数据

train=df.iloc[:a]#取数据的前a行为训练集

x_train=train.iloc[:,:b]#取训练集的前b列为属性集

y_train=train.iloc[:,b:]#取训练集的最后一列标签集

第二个实现方法：

sklearn(机器学习的库）中也有shuffle的方法。

from sklearn.utils import shuffle

df = shuffle(df)

第三个实现方法：

numpy库中也有进行shuffle的方法

df.iloc[np.random.permutation(len(df))]

敲代码的乔帮主博客专家

发布了289 篇原创文章 · 获赞 163 · 访问量 23万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/Suyebiubiu/article/details/102981689

pandas打乱数据

pandas dataframe 如何打乱数据

打乱数据

打乱数组内数据顺序

numpy利用下标打乱数据集

python 打乱数据集和标签

Pytorch使用shuffle打乱数据

打乱数组

随机打乱数组

143、打乱数组

【数组】打乱数组

打乱数组排序

简化SQL计算之打乱数据列次序（Shuffle）

随机打乱数据框DataFrame中行的顺序

Python 训练神经网络打乱数据集

【深度学习】打乱数据及keras自定义generator

Pytorch 按某个维度打乱数据方法（转载）

机器学习中打乱数据集有什么作用

python 利用numpy同时打乱列表的顺序，同时打乱数据和标签的顺序

随机打乱数组排序

python打乱数组顺序

Go随机打乱数组

js 随机打乱数组

PHP 随机打乱数组

Lua 打乱数组顺序

js打乱数组排序

【洗牌算法】- 打乱数组

JavaScript随机打乱数组

C语言打乱数组

算法小白——打乱数组

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)