利用Python进行数据分析第8章数据规整：聚合、合并和重塑.md - 代码天地

利用Python进行数据分析第8章数据规整：聚合、合并和重塑.md

其他 2019-11-04 00:17:31 阅读次数: 0

学习时间：2019/11/03 周日晚上23点半开始，计划1110学完

学习目标：Page218-249，共32页；目标6天学完（按每页20min、每天1小时/每天3页，需10天）

实际反馈：实际XXX学完，耗时X天，X小时，平均每页X分钟。

实际应用中，数据可能分散在许多文件或数据库中，存储的形式也不利于分析。本章关注可以聚合、合并、重塑数据的方法。

8.1 层次化索引

层次化索引（hierarchical indexing）是pandas的一项重要功能，它使得能在一个轴上拥有多个（两个以上）索引级别。抽象点说，它使得能以低维度形式处理高维度数据。

看以下例子，创建一个Series并用一个由列表或数组组成的列表作为索引：

　　Ps：以上结果是经过美化的带有MultiIndex索引的Series的格式。

　　

1）对于一个层次化索引的对象，可使用所谓的部分索引，使用它选取数据子集的操作更简单：

还可以在"内层"中进行选取：

2）层次化索引在数据重塑和基于分组的操作（如透视表生成）中扮演着重要的角色。如，可通过unstack方法将这段数据重新安排到一个DataFrame中：

其中，unstack的逆运算时stack：

8.1.1 重排与分级排序

8.1.2 根据级别汇总统计

8.1.3 使用DataFrame的列进行索引

8.2 合并数据集

8.2.1 数据库风格的DataFrame合并

8.2.2 索引上的合并

8.2.3 轴向连接

8.2.4 合并重叠数据

8.3 重塑和轴向旋转

8.3.1 重塑层次化索引

8.3.2 将"长格式"旋转为"宽格式"

8.3.3 将"宽格式"旋转为"长格式"

8.4 总结

至此，已经掌握了pandas数据导入、清洗、重塑，可进一步学习matplotlib数据可视化。稍后会回到pandas，学习更高级的分析。

猜你喜欢

转载自www.cnblogs.com/ElonJiang/p/11789939.html

利用Python进行数据分析第8章数据规整：聚合、合并和重塑.md

《利用Python进行数据分析·第2版》第8章数据规整：聚合、合并和重塑

第8章数据规整：聚合、合并和重塑

数据基础---《利用Python进行数据分析·第2版》第8章数据规整：聚合、合并和重塑

数据规整：聚合、合并和重塑 Pandas

数据规整：聚合、合并和重塑

[利用python进行数据分析书笔记]第7章数据规整化：清理、转换、合并、重塑

利用Python进行数据分析之第七章记录数据规整化:清理、转换、合并、重塑

数据规整化：清理、转换、合并、重塑《用Python进行数据分析》读书笔记第7章

利用Python进行数据分析-Pandas(第五部分-数据规整：聚合、合并和重塑)

《利用Python进行数据分析》第8章绘图和可视化笔记

利用Python进行数据分析之第七章记录2 数据规整化:清理、转换、合并、重塑

利用Python进行数据分析·第2版

《利用Python进行数据分析·第2版》

《利用Python进行数据分析》第9章 groupby技术和数据聚合笔记

《利用Python进行数据分析》第7章合并数据集

利用Python进行数据分析——第8章绘图及可视化——学习笔记Python3 5.0.0

《利用Python进行数据分析》第5章 pandas的数据汇总与处理缺失数据

绘图和可视化《利用Python进行数据分析》第8章读书笔记

[利用python进行数据分析书笔记]第8章绘图和可视化

转载绘图和可视化《利用Python进行数据分析》第8章读书笔记

《利用Python进行数据分析·第2版》第5章 pandas入门

《利用Python进行数据分析·第2版》第1章准备工作

《利用Python进行数据分析·第2版》第11章时间序列

《利用Python进行数据分析·第2版》第12章 pandas高级应用

利用python进行数据分析——第十四章_数据分析案例

数据集合与分组运算《利用python进行数据分析》笔记，第9章

数据加载、存储与文件格式利用Python进行数据分析第6章

《利用Python进行数据分析》第7章轴连接与数据转换

《利用Python进行数据分析》第6章数据加载、存储与文件格式

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)