《利用python进行数据分析》学习笔记--数据聚合与分组（groupby） - 代码天地

《利用python进行数据分析》学习笔记--数据聚合与分组（groupby）

其他 2018-09-10 22:19:19 阅读次数: 0

在数据聚合与分组中，主要包括：

根据一个或多个键（函数、数组、或dataframe的列名）拆分pandas对象

计算分组后数据的统计值，包括：计数，平均值，标准差，自定义函数

对dataframe的列应用各种各样的函数

实现组内转换或其他运算，规整化，线性回归，排名，选取子集

透视表，交叉表

分组分析

groupby

就是将pandas的数据对象进行，拆分---应用---合并的数据处理过程

如下面的：

df = pd.DataFrame({'key1':['a','a','b','b','a'],
                  'key2':['one','two','two','one','one'],
                  'data1':np.random.randn(5),
                  'data2':np.random.randn(5)})
df
返回
    key1    key2    data1    data2
0    a    one    0.127349    1.477832
1    a    two    -0.430755    0.397269
2    b    two    -0.911272    0.669960
3    b    one    0.370609    0.469459
4    a    one    0.968631    0.885551

当我们想要根据key1进行分组，并且计算data1列的平均值
则用到groupby进行拆分
grouped = df['data1'].groupby(df['key1'])
grouped.mean()

key1
a    0.221742
b   -0.270332

在这里，数据根据分组键进行了聚合，产生了新的Series，而且key1是唯一的索引值

当我们一次传入多个数组时：
mean = df['data1'].groupby([df['key1'],df['key2']]).mean()
mean

key1  key2
a     one     0.547990
      two    -0.430755
b     one     0.370609
      two    -0.911272
此时得到的Series具有一个层次化索引
mean.unstack（）

key2    one    two
key1        
a    0.547990    -0.430755
b    0.370609    -0.911272

分组键可以是任何长度适当的数组，也可以直接是列名（字符串，数字，）

另外，groupby的size用法，能够返回一个含有分组大小的series

对分组进行迭代

猜你喜欢

转载自www.cnblogs.com/jx1111jx/p/9623391.html

《利用python进行数据分析》学习笔记--数据聚合与分组（groupby）

《利用Python进行数据分析》第9章 groupby技术和数据聚合笔记

利用python进行数据分析——使用groupby机制对pandas对象类的数据进行聚合与分组操作

利用python进行数据分析之数据聚合和分组运算

【利用python进行数据分析】数据聚合与分组运算

利用python对2012美国大选进行数据分析(三，数据聚合与分组运算)

利用Python进行数据分析学习笔记

利用PYTHON进行数据分析学习笔记（二）

【数据分析】：python：GroupBy：数据聚合与分组运算

数据基础---《利用Python进行数据分析·第2版》第10章数据聚合与分组运算

数据集合与分组运算《利用python进行数据分析》笔记，第9章

《利用Python进行数据分析·第2版》第10章数据聚合与分组运算

利用Python进行数据分析-Pandas(第六部分-数据聚合与分组运算)

《利用Python进行数据分析》 12.2高阶GroupBy应用

python进行数据分析groupby基础操作

GroupBy技术-----python进行数据分析

【利用python进行数据分析】附录A Python 学习

python学习日记——利用python进行数据分析

《利用Python进行数据分析》笔记二

《利用python进行数据分析》读书笔记

笔记1:利用python进行数据分析

利用Python进行数据分析阅读笔记（一）

《利用python进行数据分析》笔记章节索引

利用python进行数据分析（笔记）

利用Python 进行数据分析笔记一

利用Python进行数据分析

《利用Python进行数据分析》

《利用Python进行数据分析》学习记录

利用Python进行数据分析学习记录（一）

利用Python进行数据聚合和分组运算

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)