学习笔记(15):零基础搞定Python数据分析与挖掘-数据的汇总

立即学习:https://edu.csdn.net/course/play/6861/326775?utm_source=blogtoedu

数据汇总

透视表

pd.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All')

data:数据集

values:要拉入数值的字段列表

index:要拉入行标签的字段列表

columns:要拉入列标签的字段列表

aggfunc:统计函数,默认统计均值

fill_value:填充缺失值

margins:是否显示行或列的总计值

dropna:是否删除整列为缺失的字段

margins_name:指定行或列的总计名称

分组汇总

groupby方法:用于汇总前,设定被分组的变量

要分组的数据集.groupby=(['变量1', '变量2'])

aggregate方法:可基于groupby的结果做进一步统计汇总

分组后的数据集.aggregate=({'变量':方法})

np.min np.max np.size np.mean......

调整变量名顺序

pd.DataFrame(数据集, columns=(['变量名1', '变量名2', '变量名3'])

对变量重新命名

 数据集.rename=(colums={'原变量名':'新变量名'}, inplace=True)

发布了15 篇原创文章 · 获赞 1 · 访问量 150

猜你喜欢

转载自blog.csdn.net/weixin_42812109/article/details/105330566
今日推荐