pandas 基础

Pandas  : 

       Python Data Analysis Library  或 pandas 是基于Numpy 的一种工具,   该工具是为了解决数据分析任务而创建的

 pandas 纳入了大量库和一些标准的数据模型,提供了高效的操作发现数据所需的工具

pandas 提供了大量能使我们快速处理数据和函数的方法

它是Python 成为强大而高效的数据分析环境的重要因素之一

1. Series  类似于一维数组的对象,由 values(一组数据),Index(相关数据索引标签)

2. Series的创建:

   两种创建方式:

          

注意: 由 adarray 创建的是引用,而不是副本,对series的改变也会改变原来的ndarray对象中的元素,(列表没有这种情况)

2)由字典创建;


s2 = Series({'a':1,'b':2,'c':5})
s2
Out[28]:

 3,索引   显示索引 、隐式索引

         显示索引使用 index中的元素作为索引值,使用 .loc[]  (推荐)

         隐式索引使用 整数作为索引值,使用 .iloc[]  (推荐)

          当索引没有对应的值时,可能出现缺失数据显示 Nan ()

       可以使用pd.isnull(),pd,nonull(),或者自带属性 isnull(),notnull函数检测缺失数据

       可以通过head().tail()快速查看Series 对象的样式

4,切片  n.loc['a':'f']

5,  可以吧 series 看成一个定长 的有序字典

    可以通过 shape,size,index,values 等得到 series的属性

6. Series 对象本身及其实例对象都有一个那么属性

    # name区分,DataFrame中用于区分

7. Series 的运算

       Series 

        相加:  运算是吧索引相同的值进行运算,如果想要其他的值也显示,使用

     n1.add(s2,fill_value= 0)



猜你喜欢

转载自blog.csdn.net/shilaike2/article/details/80380763