pandas分组统计：groupby，melt，pivot_table，crosstab的用法 - 代码天地

pandas分组统计：groupby，melt，pivot_table，crosstab的用法

其他 2019-06-19 14:16:48 阅读次数: 0

groupby: 分组

melt: 宽表转长表

pivot_table: 长表转宽表，数据透视表

crosstab: 交叉表 / 列联表，主要用于分组频数统计

df = DataFrame({'key1':['a','a','b','b','a'],'key2':['one','two','one','two','one'],
　　　　　　　　'data1':np.random.randn(5),'data2':np.random.randn(5)})
#[Out]#       data1     data2 key1 key2
#[Out]# 0  0.439801  1.582861    a  one
#[Out]# 1 -1.388267 -0.603653    a  two
#[Out]# 2 -0.514400 -0.826736    b  one
#[Out]# 3 -1.487224 -0.192404    b  two
#[Out]# 4  2.169966  0.074715    a  one

# groupby 用法
group1 = df.groupby('key1')
group2 = df.groupby(['key1','key2'])
[x for x in group1]
group1.size()
group1.sum()
group2.count()
group1['data1','data2'].agg(['mean','sum'])  #作用于所有列
group2(['key1','key2']).apply(lambda x: pd.Series([x.shape[0], x['key1'].mean(), x['key2'].sum()], 
　　　　　　　　　　　　　　　　　　　　　　　　　　　index=['counts', 'key1_mean', 'key2_sum']))  #作用于指定列

# melt 用法
pd.melt(df, id_vars=['key1', 'key2'], value_vars=['data1', 'data2'], var_name='var', value_name='value')  #col_level

# crosstab 用法
pd.crosstab(df.key1, df.key2, margins=True)

# pivot_table 用法
# pd.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, 
# 　　　　　　　　dropna=True, margins=False, margins_name='ALL')  #aggfunc={'d':np.sum, 'e':np.max}
pd.pivot_table(df, index='key1', columns='key2')
df.pivot_table(['data1'], index='key1', columns='key2', fill_value=0)

　　参考链接：

Pandas：透视表(pivotTab)和交叉表(crossTab)

pandas模块，Melt函数

Pandas分组统计函数：groupby、pivot_table及crosstab

猜你喜欢

转载自www.cnblogs.com/iupoint/p/11050887.html

pandas分组统计：groupby，melt，pivot_table，crosstab的用法

Pandas分组统计函数：groupby、pivot_table及crosstab

pandas pivot pivot_table groupby crosstab用法与区别详解

pandas中的pivot_table和crosstab

pandas之groupby分组与pivot_table透视表

pivot_table() crosstab()

Pandas —— 透视表pivot_table()和交叉表crosstab()

pandas的groupby以及pivot_table用法——以计算恩格尔系数为例

pandas中的groupby、transform以及pivot_table

Pandas reshape相关函数介绍（pivot，pivot_table，stack，unstack，melt）

Pandas melt和pivot_table比excel透视表好用多了

pandas dataframe pivot_table

stack,unstack,groupby,pivot_table的区别

透视表pivot_table和交叉表crosstab

pandas pivot_table或者groupby实现sql 中的count distinct 功能

pandas中pivot_table透视表

详解 Pandas 透视表（pivot_table）

Pandas透视表（pivot_table）详解

Pandas透视表（pivot_table）说明

pandas的透视表pivot_table

Pandas 透视表pivot_table详解

Pandas中pivot_table的使用

用groupby 配合unstack,可以实现pivot_table

pandas数据处理实践五（透视表pivot_table、分组和透视表实战Grouper和pivot_table）

pandas melt 与pivot 函数

pandas pivot_table 活学活用实例教程

Pandas数据透视表之pivot_table

51 pandas pivot_table数据透视表（tcy）

Pandas 一文看懂透视表pivot_table

pandas的透视表pivot_table使用简介

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)