Pandas统计分析-分组->透视->可视化

数据 分组 聚合 运算

聚合

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

飞行综合

flights = pd.read_csv('data/flights.csv')
1 显示部分数据
2 按照AIRLINE分组, 使用agg方法, 传入要聚合的列和聚合函数
  flights.groupby('AIRLINE').agg({'ARR_DELAY':'mean'}).head()
3 或者要选取的列使用索引, 聚合函数作为字符串传入agg
flights.groupby('AIRLINE')['ARR_DELAY'].agg('mean').head()
4 每家航空公司每周平均每天取消的航班数
flights.groupby(['AIRLINE', 'WEEKDAY'])['CANCELLED'].agg('sum').head(10)
5 分组可以是多组, 选取可以是多组, 聚合函数也可以是多个
 每周每家航空公司取消或改变航线的航班总数和比例
group1 = flights.groupby(['AIRLINE', 'WEEKDAY'])['CANCELLED', 'DIVERTED']
group1.agg(['sum', 'mean']).head(7)
6 # 用列表和嵌套字典对多列分组和聚合
# 对于每条航线, 找到总航班数, 取消的数量和比例,飞行时间的平均时间和方差
group_cols = ['ORG_AIR', 'DEST_AIR']
agg_dict = { 'CANCELLED':['sum', 'mean', 'size'],
             'AIR_TIME':['mean', 'var']}
flights.groupby(group_cols).agg(agg_dict).head()
7 # 按'AIRLINE', 'WEEKDAY'分组, 分别对DIST和ARR_DELAY聚合
airline_info = flights.groupby(['AIRLINE', 'WEEKDAY'])
airline_info = airline_info.agg({ 'DIST':['sum', 'mean'],
                   'ARR_DELAY':['min', 'max'] }).astype(int)
airline_info.head()

在这里插入图片描述
在这里插入图片描述

分组
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

大学数据集

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

删除这三列缺失值
在这里插入图片描述

在这里插入图片描述

数据透视表

数据透视表

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

交叉表

在这里插入图片描述

综合练习

在这里插入图片描述

读取显示前8
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

表中数据做索引,后面列都是数值
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

Pandas可视化

线性表

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

四列累加和的直方图
在这里插入图片描述

柱状图

bar条状
在这里插入图片描述
在这里插入图片描述


在这里插入图片描述

barth水平堆叠
在这里插入图片描述

直方图 密度图

在这里插入图片描述
在这里插入图片描述

频度出现次数
alpha是透明度
在这里插入图片描述

堆叠 bins堆个个数
在这里插入图片描述

在这里插入图片描述

散点图

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

scatter散点图

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

s 控制大小
在这里插入图片描述

其他图

在这里插入图片描述

发布了234 篇原创文章 · 获赞 164 · 访问量 14万+

猜你喜欢

转载自blog.csdn.net/weixin_43469680/article/details/105411499
今日推荐