24、python对数据框进行分组统计简单操作

分组分析:是指根据分组字段,将分析对象划分成不同的部分,已进行对比分析各组之间的差异性的一种分析方法

常见的统计指标:

计数
求和
平均值

1 函数
01 分组统计函数:
groupby(by=[分组列1,分组列2,...])[统计列1,统计列2,。。。]
.agg({统计列名1:统计函数1,统计列名2:统计函数2,。。。})

参数说明:

by: 用于分组的列
中括号:用于统计的列
agg: 统计别名显示统计值的名称,统计函数用于统计数据

02 常用统计函数    注释
size           计数
sum            求和
mean           均值

2 案例说明

import pandas

data=pandas.read_csv(
        'D:\\DATA\\pycase\\5.2分组分析\\data.csv',
            engine='python',
            sep=',',
            encoding='utf8'
            )

# 分组进行统计
# by 后边是分组列,score是统计列

import numpy

aggResule=data.groupby(
        by=['class']
        )['score'].agg({
                '总分': numpy.sum,
                '人数': numpy.size,
                '平均值': numpy.mean
                })

猜你喜欢

转载自blog.csdn.net/qq_36327687/article/details/84771196