python数据分层抽样工具类 - 代码天地

python数据分层抽样工具类

其他 2019-01-17 00:45:48 阅读次数: 0

import  pandas as pd
import random as rd
import numpy as np
import math as ma


def typeicalSampling(group, typeicalFracDict):
    name = group.name
    frac = typeicalFracDict[name]
    return group.sample(frac=frac)
def group_sample(data_set,lable,typeicalFracDict):
    #分层抽样
    #data_set数据集
    #lable分层变量名
    #typeicalFracDict：分类抽样比例
    gbr=data_set.groupby(by=[lable])
    result=data_set.groupby(lable,group_keys=False).apply(typeicalSampling,typeicalFracDict)
    return result

data = pd.DataFrame({'id': [3566841, 6541227, 3512441, 3512441, 3512441,3512441, 3512441, 3512441, 3512441, 3512441],
                   'sex': ['male', 'Female', 'Female','male', 'Female', 'Female','male', 'Female','male', 'Female'],
                   'level': ['high', 'low', 'middle','high', 'low', 'middle','high', 'low', 'middle','middle']})

data_set=data
label='sex'
typicalFracDict = {
    'male': 0.8,
    'Female': 0.5
}
result=group_sample(data_set,label,typicalFracDict)
print(result)

id sex level
7 3512441 Female low
1 6541227 Female low
2 3512441 Female middle
8 3512441 male middle
6 3512441 male high
0 3566841 male high

资源来自网上自己稍微整理了下

猜你喜欢

转载自blog.csdn.net/qq_14865711/article/details/83616416

python数据分层抽样工具类

分层抽样

sklearn分层抽样

GEE：分层抽样

基于分层抽样的交叉验证（构造一个类） | python实现

StratifiedKFold实现分层抽样

方差缩减——分层抽样

Matlab 对数据按类别进行分层抽样

Python 珍藏函数超详解：随机抽样，分层抽样，系统抽样方法汇总

分层取样，分层抽样法

R语言分层抽样(strata函数)

分层抽样原理及Oracle实现

sklearn,交叉验证中的分层抽样

SAS 分层抽样示例代码

R语言随机抽样及分层抽样

随机抽样、分层抽样、整群抽样、系统抽样的区别

EL之RF(RFC)：利用RF对多分类问题进行建模并评估(六分类+分层抽样)

Spark 分层抽样与求最大值最小值

pandas样本分层抽样（可以自己设置每一个类别抽取多少个样本）

Python数据抽样

python笔记：使用数据结构的凝聚分层聚类

python数据预处理：数据抽样

Python验证数据的抽样分布类型

Python 实现分层聚类算法

python笔记14:数据处理之随机抽样

如何实现DBCP数据库连接池工具类＆mvc分层开发web流程操作？

python：抽样和抽样方法-诺禾

python抽样总结

python 抽样分布实践

[Python] 随机抽样

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)