数据聚合与运算
1. 在这个章节中用到的最多的函数是GroupBy
pandas.DataFrame.groupby — pandas 1.4.2 documentation
跟着官方的指导手册来完成题目
df = pd.DataFrame({'Animal': ['Falcon', 'Falcon',
'Parrot', 'Parrot'],
'Max Speed': [380., 370., 24., 26.]})
df
Animal Max Speed
0 Falcon 380.0
1 Falcon 370.0
2 Parrot 24.0
3 Parrot 26.0
df.groupby(['Animal']).mean()
Max Speed
Animal
Falcon 375.0
Parrot 25.0
也就是可以对该字段进行分组的统计
但是最好用的部分我感觉还是在数据筛选
df.groupby(level=0).mean()
也就是对于这个字段可以筛选出字段为0的数据进行计算
当然,除了.mean,包括一些最大值最小值以及其他的运算符号都是可以带入计算的。
2. 把数据变为Series类型的数据
看到这个题目的时候,其实也比较疑惑,为什么要进行这个计算。于是来CSDN来查看相关的资料。
后来查了一些资料:DataFrame的单列数据为一个Series
大概就是通过一些截取将某列的数据单独拎出来形成一个Series