开门见山
1.准备数据集
import pandas as pd
data={
"tag":["a","a","a","b",'b',"b","b"],
"nums":[1,2,3,4,5,6,7]
}
dataFrame=pd.DataFrame(data)
数据集长这样:
tag | nums |
---|---|
a | 1 |
a | 2 |
a | 3 |
b | 4 |
b | 5 |
b | 6 |
b | 7 |
需求
对tag进行groupBy分组,并对组内nums列的值求和
代码如下:
dataFrame.groupby("tag").agg({"nums":"sum"})
显示的结果如下:
nums | |
---|---|
tag | |
a | 6 |
b | 22 |
可以看到显示的结果中,tag列和nums列的水平位置并不是一样的。那么如果想要得到tag 和nums在同一行的话,就得要这样去做:
dataFrame.groupby("tag").agg({"nums":"sum"}).reset_index()
tag | nums |
---|---|
a | 6 |
b | 22 |
总结:
这个reset_index()很关键啊啊啊啊啊啊~