DataWhale学习笔记--数据重构

数据聚合与运算

1. 在这个章节中用到的最多的函数是GroupBy

pandas.DataFrame.groupby — pandas 1.4.2 documentation 

跟着官方的指导手册来完成题目

df = pd.DataFrame({'Animal': ['Falcon', 'Falcon',
                             'Parrot', 'Parrot'],
                'Max Speed': [380., 370., 24., 26.]})
df
   Animal  Max Speed
0  Falcon      380.0
1  Falcon      370.0
2  Parrot       24.0
3  Parrot       26.0
df.groupby(['Animal']).mean()
        Max Speed
Animal
Falcon      375.0
Parrot       25.0

也就是可以对该字段进行分组的统计

但是最好用的部分我感觉还是在数据筛选

df.groupby(level=0).mean()

也就是对于这个字段可以筛选出字段为0的数据进行计算

当然,除了.mean,包括一些最大值最小值以及其他的运算符号都是可以带入计算的。

2. 把数据变为Series类型的数据

看到这个题目的时候,其实也比较疑惑,为什么要进行这个计算。于是来CSDN来查看相关的资料。

后来查了一些资料:DataFrame的单列数据为一个Series

大概就是通过一些截取将某列的数据单独拎出来形成一个Series

猜你喜欢

转载自blog.csdn.net/weixin_44897685/article/details/124902933