Pandas :
Python Data Analysis Library 或 pandas 是基于Numpy 的一种工具, 该工具是为了解决数据分析任务而创建的
pandas 纳入了大量库和一些标准的数据模型,提供了高效的操作发现数据所需的工具
pandas 提供了大量能使我们快速处理数据和函数的方法
它是Python 成为强大而高效的数据分析环境的重要因素之一
1. Series 类似于一维数组的对象,由 values(一组数据),Index(相关数据索引标签)
2. Series的创建:
两种创建方式:
注意: 由 adarray 创建的是引用,而不是副本,对series的改变也会改变原来的ndarray对象中的元素,(列表没有这种情况)
2)由字典创建;
s2
3,索引 显示索引 、隐式索引
显示索引使用 index中的元素作为索引值,使用 .loc[] (推荐)
隐式索引使用 整数作为索引值,使用 .iloc[] (推荐)
当索引没有对应的值时,可能出现缺失数据显示 Nan ()
可以使用pd.isnull(),pd,nonull(),或者自带属性 isnull(),notnull函数检测缺失数据
可以通过head().tail()快速查看Series 对象的样式
4,切片 n.loc['a':'f']
5, 可以吧 series 看成一个定长 的有序字典
可以通过 shape,size,index,values 等得到 series的属性
6. Series 对象本身及其实例对象都有一个那么属性
# name区分,DataFrame中用于区分
7. Series 的运算
Series
相加: 运算是吧索引相同的值进行运算,如果想要其他的值也显示,使用
n1.add(s2,fill_value= 0)