pandas样本分层抽样（可以自己设置每一个类别抽取多少个样本） - 代码天地

pandas样本分层抽样（可以自己设置每一个类别抽取多少个样本）

其他 2020-01-31 13:07:51 阅读次数: 0

import numpy
import pandas as pd

data = pd.read_csv('data.csv')
numpy.random.seed(seed=2)  # 如果使用相同的seed( )值，则每次生成的随即数都相同，

# 用groupby进行数据的分组,根据班级
# gbr = data.groupby('class')
# 获取分组后gbr的数据
# gbr.groups

# 分层抽样字典定义 组名：数据个数
typicalNDict = {1: 5000, 0: 5000}


# 函数定义
def typicalsamling(group, typicalNDict):
    name = group.name
    n = typicalNDict[name]
    return group.sample(n=n)


#    返回值：抽样后的数据框
result = data.groupby('class').apply(typicalsamling, typicalNDict)
print(result.head())
result.to_csv('smallData.csv', index=False)

我们可以使用pandas中value_counts方法查看每个类别下面具体有多少个样本，检查我们代码是否正确（这个抽样是随机的）

print(df['class'].value_counts())

敲代码的乔帮主博客专家

发布了289 篇原创文章 · 获赞 163 · 访问量 23万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/Suyebiubiu/article/details/102985410

pandas样本分层抽样（可以自己设置每一个类别抽取多少个样本）

基于分层抽样的交叉验证（构造一个类） | python实现

一个挖矿样本分析

一个TCP可以发送多少个请求

Matlab 对数据按类别进行分层抽样

论文浅尝 | 大型语言模型不是一个好的少样本信息抽取工具，但对于困难样本是一个好的重排工具...

Scrapy 为每一个Spider设置自己的Pipeline

一个.net样本的简单分析

分层抽样

sklearn分层抽样

GEE：分层抽样

样本抽样

夺命连环问：一个 TCP 连接可以发多少个 HTTP 请求？

一个TCP连接可以发多少个HTTP请求

一个 TCP 连接可以发多少个 HTTP 请求？

一个 TCP 连接可以发多少个 HTTP 请求？

一个 TCP 连接可以发多少个 HTTP 请求

一个 TCP 连接可以发多少个 HTTP 请求?

面试官：一个 TCP 连接可以发多少个 HTTP 请求?

面试官：一个TCP连接可以发多少个HTTP请求？

Windows平台一个进程可以CreateThread开多少个线程

一个进程最多可以创建多少个线程？

尊重自己的每一个选择

jenkins 可以设置最多执行并发执行多少个

今天面试遇到这样一个问题：一个TCP连接可以发多少个HTTP请求？

SSD目标检测训练自己的数据集：计算数据集当中每一个类别的框的数量

StratifiedKFold实现分层抽样

方差缩减——分层抽样

pytorch训练（一）——如何使用pytorch创建自己的数据集（含图像的分割处理-一个样本图片分为多个样本图片）

一张表可以有多少个主键

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)