pandas对不同类别进行填充缺失值:df.transform聚合方法的巧用 - 代码天地

pandas对不同类别进行填充缺失值:df.transform聚合方法的巧用

编程语言 2023-08-18 20:35:08 阅读次数: 0

首先看数据：

import pandas as pd
x = pd.DataFrame([[166,52,'男'],[152,43,'女'],[182,73,'男'],[172,63,'女'],[np.nan,np.nan,'女'],[np.nan,np.nan,'男']],columns = ['身高','体重','性别'])
x

常用的填充缺失值的方法为使用均值、众数等进行填充，如下：

但当我们需要对不同类别数据进行填充其类别的均值时，可能比较麻烦，大家常用的思路可能如下，即取出不同类别的数据，然后依次填充：

labels = x['性别'].unique()
for label in labels:
    for col in x.columns[:-1]:
        data_ = x.loc[x['性别']==label, col]
        x.loc[x['性别']==label, col] = data_.fillna(data_.mean())
print(x)

但我们可以使用分组以及transform聚合方法更简便的完成这个操作：


x = pd.DataFrame([[166,52,'男'],[152,43,'女'],[182,73,'男'],[172,63,'女'],[np.nan,np.nan,'女'],[np.nan,np.nan,'男']],columns = ['身高','体重','性别'])

x.loc[:,x.columns != '性别'] = x.groupby('性别').transform(lambda x:x.fillna(x.mean()))
print(x)

transform方法的作用为对分组后的数据聚合得到的数返回给每一行（若聚合得到为单个标量，则返回给每一行，即同一个组别的每一行数据相等，若聚合得到的为原数据的大小，则对应返回给原数据，如这里结果）,在这里对性别进行分组后，对每个组进行填充然后返回到原数据，即可实现对不同组别进行填充。

猜你喜欢

转载自blog.csdn.net/weixin_46707493/article/details/126740393

pandas对不同类别进行填充缺失值:df.transform聚合方法的巧用

使用pandas对缺失值进行填充处理

Pandas 填充缺失值

Pandas对不同类型缺失值的转换规则

pandas检查、填充缺失值的几种方法总结

pandas || df.dropna() 缺失值删除

Pandas DataFrame缺失值的查找与填充

pandas缺失值填充时遇到的问题

使用R进行缺失值填充

pandas处理缺失值df.dropna( )的thresh参数

不同缺失值的删除方法

##############缺失值填充的几种方法

缺失值的常见填充方法

python缺失值填充的几种方法

python | pandas 改变列的位置、填充缺失值

pandas (十) 缺失值的处理：填充、删除、过滤、查询

python教程：Pandas之Fillna填充缺失数据的方法

缺失值填充，众数

python缺失值填充

pandas填补缺失值的方法

pandas的fillna()方法-填充空值

缺失值处理的常用方法：判断、查找、填充及删除

SSL证书不同类别的区别

不同类别游戏音效的特点

[ python ] pandas学习笔记（五）对缺失值的处理检测、丢弃、填充空值

pandas对数据中缺失值进行处理

pandas缺失值处理

pandas 处理缺失值

Pandas对缺失值的处理

pandas 筛选缺失值

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)