pandas分组与聚合

import pandas as pd
import numpy as np


# 加载数据
detail = pd.read_excel('meal_order_detail.xlsx')
# print(detail)

# 分组
# 按照amounts进行分组,然后统计counts平均值
# de = detail.groupby(by='amounts')['counts'].mean()
# print(de)

# 按照order_id 与 dishes_id 进行分组,统计amounts的均值
# de = detail.groupby(by=['amounts','dishes_name'])['counts'].max()
# print(de)
# print(type(de))

# agg方法 --可以对多列数据, 同时进行多列统计分析
# de = detail[['counts', 'amounts']].agg([np.sum, np.mean])
# print(de)

# agg 方法 --对于不同列数据求取不同统计分析
# de = detail.agg({'counts':np.max, 'amounts':np.min})
# print(de)

# agg 方法  --可以对不同那个列数据求取不同的统计分析
# de = detail.agg({'counts':np.max, 'amounts':[np.min, np.mean]})
# print(de)

# apply 自定义统计
# 单列操作
# de = detail['amounts'].apply(lambda x: x+1)
# print(de)

# 多列操作
# de = detail[['counts','amounts']].transform(lambda x:x+1)
# print(de)

猜你喜欢

转载自blog.csdn.net/YPL_ZML/article/details/93540261