Excel处理数据不够用了?pandas创始人手把手教你利用Python进行数据分析

为什么要利用Python进行数据分析?

对于数据分析师从业者而言,经常需要从事:数据库操作、报告撰写、数据可视化、数据挖掘的工作。这些工作不写代码也可以操作,利用Excel 进行数据可视化、使用 SPSS等一些亲民类平台工具进行数据挖掘,虽然使用平台工具虽然可造作性强,但是不可避免的会存在重复机械的劳动,从而降低自己的工作效率,但如果你会用Python 编写代码,操作的自由度更高,发展的潜力更大。

怎么利用Python进行数据分析?

在这里推荐这本《利用Python进行数据分析》,该书适合刚刚接触Python的数据分析的小白。将IPython这个交互式Shell作为你的首要开发环境,讲述了从pandas库的数据分析工具开始利用高性能工具等内容。

直接来展示一下:

第1章 准备工作

1.1 本书的内容

1.2 为什么要使用Python进行数据分析

1.3 重要的Python库

1.4 安装和设置

img

第2章 Python语法基础,IPython和Jupyter Notebooks

2.1 Python解释器

2.2 IPython基础

2.3 Python语法基础

img

第3章 Python的数据结构、函数和文件

3.1 数据结构和序列

3.2 函数

3.3 文件和操作系统

3.4 结论

img

第4章 NumPy基础:数组和矢量计算

4.1 NumPy的ndarray:一种多维数组对象

4.2 通用函数:快速的元素级数组函数

4.3 利用数组进行数据处理

4.4 用于数组的文件输入输出

img

第5章 pandas入门

5.1 pandas的数据结构介绍

5.2 基本功能

5.3 汇总和计算描述统计

5.4 总结

img

第6章 数据加载、存储与文件格式

6.1 读写文本格式的数据

6.2 二进制数据格式

6.3 Web APIs交互

6.4 数据库交互

6.5 总结

img

第7章 数据清洗和准备

7.1 处理缺失数据

7.2 数据转换

7.3 字符串操作

7.4 总结

img

第8章 数据规整:聚合、合并和重塑

8.1 层次化索引

8.2 合并数据集

8.3 重塑和轴向旋转

8.4 总结

img

第9章 绘图和可视化

9.1 matplotlib API入门

9.2 使用pandas和seaborn绘图

9.3 其它的Python可视化工具

9.4 总结

img

第10章 数据聚合与分组运算

10.1 GroupBy机制

10.2 数据聚合

10.3 apply:一般性的“拆分-应用-合并”

10.4 透视表和交叉表

10.5 总结

img

第11章 时间序列

11.1 日期和时间数据类型及工具

11.2 时间序列基础

11.3 日期的范围、频率以及移动

11.4 时区处理

img

第12章 pandas高级应用

12.1 分类数据

12.2 GroupBy高级应用

12.3 链式编程技术

12.4 总结

img

第13章 Python建模库介绍

13.1 pandas与模型代码的接口

13.2 用Patsy创建模型描述

13.3 statsmodels介绍

13.4 scikit-learn介绍

13.5 继续学习

img

第14章 数据分析案例

14.1 来自Bitly的USA.gov数据

14.2 MovieLens 1M数据集

14.3 1880-2010年间全美婴儿姓名

14.4 USDA食品数据库

14.5 2012联邦选举委员会数据库

14.6 总结

img

篇幅有限,这里就不过展示

朋友们如果需要这份完整的资料可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

猜你喜欢

转载自blog.csdn.net/WANGJUNAIJIAO/article/details/130760585