pandas 高级三(数据变形-分组与聚合)

目录

以下示例均导入以下包

import pandas as pd
from numpy import nan as Na
import numpy as np
from pandas import DataFrame,Series
import sys
agg(func)
agg实现了apply+combine
    func取内置聚合函数(如max,min)
    func取自定义函数
    func取函数列表
    func取key为列名、value为函数的dict
结果
    行索引为groupby 的by值
    列名:
        当func为一个函数时,列名为原始列名
        当func有多个函数时,多层索引(外层为原始列名,内层为函数列表)


    func取自定义函数:
        默认传入参数为分组后的dataframe对象的一列,一列列处理。


    groupby函数
        groupby(by=None)
        groupby实现了split过程
        df.groupby("key1").mean()   #指定列分组,Na值行丢掉
1 直接根据 key 进行分组

这里写图片描述

2 通过字典 /Series 分组

这里写图片描述

3 自定义函数,先groupby分组,再agg()调用聚合函数

这里写图片描述

4 将分组的列作为索引

这里写图片描述

5 导入文件,先分组再使用聚合函数

这里写图片描述

6 DataFrame 加权平均数

这里写图片描述

猜你喜欢

转载自blog.csdn.net/wsp_1138886114/article/details/80804915
今日推荐