数据分析进阶库Pandas

Python数据分析实战:https://www.lanzous.com/i2njpva
如果有条件请支持正版:http://product.dangdang.com/24025329.html

如果你英文功底好,看官方文档效果更佳,这些书不过是翻译官方文档的,而且翻译的只是常用功能。另外,第三方库只是减少时间的工具,一些算法和思想才是关键。程序员并不是只会调包的调包侠。
Pandas官方文档:http://pandas.pydata.org/

Numpy: 其实就是增加了一个ndarray数据结构,然后就是对ndarray的操作
Pandas:增加了Series、DataFrame 和Panel三种数据结构,分别是一维、二维和三维容器。学习pandas,只是学习操作Series、DataFrame的一些方法

  • Series:由索引和数据两个数组组成,和数组的区别在于数组的索引只能为自然数,而Series的索引可以是字符串,但数据数组其实就是ndarray类型,在运算上几乎和ndarray一样
  • DataFrame:由行索引、列索引和二维数据组成,只是Series的二维拓展
  • Panel:三维拓展,不常用

1、创建Series
s = pandas.Series(data, index, dtype, copy)

  • data: 标量、数组、列表或字典,其实生成器也行。如果是标量,(数值、字符串),且给定index,则index所有值均为该标量;如果是ndarray数组,默认不会复制一份数据;如果是字典,python版本需3.6+
  • index:列表、数组、生成器、pandas里面的index类
  • dtype:同numpy
  • copy:是否复制一份数据,默认为False

2、切片和索引
s = pandas.Series(range(5), index=list(‘range’))
s: r 0
a 1
n 2
g 3
e 4
s[1],s[‘a’] ,s.get(‘a’) # 1
s[1:],s[[‘a’,‘n’,‘g’,‘e’]]
s[‘s’] # keyError
其实和ndarray数组一样

3、创建DataFrame
d = pandas.DataFrame(data, index, columns, dtype, copy)

  • data: 二维列表、嵌套字典、二维ndarray数组、DataFrame
  • index: 行索引
  • columns:列索引

4、Series和DataFrame的常用方法
百度上总结的都很好,比如:
https://www.cnblogs.com/zhouzhishuai/p/8042960.html
https://blog.csdn.net/a786150017/article/details/78573055

猜你喜欢

转载自blog.csdn.net/Qwertyuiop2016/article/details/85116171