3小时入门numpy,pandas,matplotlib

使用Python中的三个库可以优雅地进行数据分析,得到一只野生的Matlab,这三个库是numpy,pandas 和 matplotlib。

numpy是高性能科学计算和数据分析的基础包,其array多维数组拥有丰富的数据类型,基于向量化技术可以有效代替循环,代码简单速度极快。

以numpy为基础的pandas中的数据框dataframe集数据分析工具万象于一身,可以像array数组一样进行复杂计算,又可以像excel一样地操作数据,又可以像SQL一样地操作数据。

而matplotlib进一步以matlab风格实现了绘图功能。其强大的数据可视化能力可以让你的数据分析结果颜值倾城。

一、numpy 库

numpy提供了三种常用的对象,数组array、矩阵matrix和ufunc(universal function)。

1,创建array

2,访问array元素

3,array运算

4,使用matrix运算

5,使用ufunc对象

二、pandas 库

pandas中的DataFrame是交互性最好在数据分析中使用最广泛的数据结构。

pandas 中常用的数据结构有:

(1)Series:一维数组,与Numpy中的一维array类似。

Series中只允许存储相同的数据类型。

(2)DataFrame:二维的表格型数据结构。

可以将DataFrame理解为Series的容器。

(3)Panel :三维的数组,可以理解为DataFrame的容器。

1,Series对象

2,创建DataFrame对象

3,从excel中读入DataFrame对象

4,增加行

5,删除行

6,增加列

7,删除列

8,移动列

9,排序

10,拼接

11,选取数据

有三种选取数据的方法:下标索引、标签索引、布尔索引。

12,导出到csv文件或excel文件

13,常用统计函数

14,时间格式

三,matplotlib 库

matplotlib 支持函数式绘图和面向对象绘图两种绘图方式。

函数式绘图方式与matlab风格一致,先用一条语句画出图像,然后用一系列函数去修饰。而面向对象绘图方式一般自上而下完成,先创建figure,然后再创建子图ax,然后绘制data,最后设计各种辅助元素 (包括 xaxis, yaxis, title, grid,legend, annotate 等 )。

1,折线图

2,条形图

3,柱形分布图

4,散点图

5,饼图

6,绘制子图

Appendix:Ipython notebook 常用快捷键

  • Tab  对象补全

  • Shift + Tab 对象提示帮助

  • Ctrl + Enter 运行当前cell

  • Shift + Enter 运行当前cell,并选中下一个cell

  • Alt + Enter 运行当前cell,并在下方创建一个空的cell

  • Esc * M 切换成markdown输入状态

  • Esc * A 在上方插入cell

  •  Esc * B 在下方插入cell

猜你喜欢

转载自blog.csdn.net/python_ai_road/article/details/81158222