以下示例均导入以下包
import pandas as pd
from numpy import nan as Na
import numpy as np
from pandas import DataFrame,Series
import sys
agg(func)
agg实现了apply+combine
func取内置聚合函数(如max,min)
func取自定义函数
func取函数列表
func取key为列名、value为函数的dict
结果
行索引为groupby 的by值
列名:
当func为一个函数时,列名为原始列名
当func有多个函数时,多层索引(外层为原始列名,内层为函数列表)
func取自定义函数:
默认传入参数为分组后的dataframe对象的一列,一列列处理。
groupby函数
groupby(by=None)
groupby实现了split过程
df.groupby("key1").mean() #指定列分组,Na值行丢掉
1 直接根据 key 进行分组
2 通过字典 /Series 分组
3 自定义函数,先groupby分组,再agg()调用聚合函数
4 将分组的列作为索引
5 导入文件,先分组再使用聚合函数