0基础利用python数据分析----pandas3利用索引的基本操作

用字典的方法创建DataFrame:

用字典的方法也可以创建dataframe对象:

创建一个嵌套的字典,导入dataframe对象之后可以直接转换成一个二维数组,其中,第一个键名就作为了该数组的列索引,嵌套内的键名就成了行索引。

调出数组的索引及数据:

pandas还可以对数组的行索引,与列索引单独提取出来,方便查看与调用:

创建了dataframe对象之后,如果想要提取它的列索引直接调用该变量名,在后面加上.columns,他就会返回一个对象,这个对象你可以把它想象成一维数组,如果想要单独在提出相应的列索引,可以在这个一维数组后面再加个索引,但是注意,列索引,和行索引都不可以更改,这应该是为了数据的安全性,如果你对他进行修改,他会报错。

行索引与列索引的使用方法基本是一致的。

在该对象后面调用.value 你就可以看到该数组的所有数据内容。

给行索引和列索引加一个标题:

通过创建好的dataframe对象,可以给它的行索引和列索引加一个名称,这可以方便我们观察行和列的内容:

在这里我们要注意,name对应的是列索引,nature对应的是行索引。

重新索引:

重复索引大概是什么意思呢,咱们可以把它理解为,当你已经有了一个数组了,如果想把它改为其他索引,这个索引如果数量大于当前的索引数量,多出来的对应值字段会有NaN,我们可以通过fill_value= 的方法填补这个空值:

在图中,我们先创建了一个Series对象,它的索引设定为123456,当前对象有6个值,如果我们想要对他进行重新排列索引,如第二个箭头,第二个箭头我们多了两个索引,这个时候我们对应的数据会出现空值,如果不调用一个变量来接受他,在运行该对象,还是这个原值。

如果我们想要替换这个空值,可以再用reindex的同时在后面加一个fill_value = 的方法将空值补充,可以用字符串,也可以用数字,因情况而定,这个xx是我随便填写的。

空值填充方法:

在这里我们创建了一个新的Series对象,它的索引为0,2,4,然后我们对该索引对象进行重新的排列,给他拍的新的索引为0,1,2,3,4,5,6,;排列完成后当然对应的值字段会有很多的空值,pandas还准备了多种填充方法,这个ffill是向下填充。有点类似excel中的填充方法。method 还有一个方法是向上填充,就是被ffill前面加一个b, method = "bffill" 这个就是向上填充了。

DataFrame的重新索引:

当然这个功能在DataFrame里面也同样适用:

在图中,我们创建了一个dataframe对象,然后重新对他排列了行索引,如果想对他重新排列列索引可以这样做:

在这里要注意,填写行的索引和列的索引是有先后顺序的,如果我想要对空值进行填补的话,方式与Series对象对空值填充的方式是一样的:

在这里我们也可以通过fill_value的方式来对空值进行填充,当然在这里填充方法与Series也很像:

在这里method也可以向上,或者下填充。

删除指定轴上的项:

 

 

 

首先我们导入一份数据,我们想要删除某一行就这么干:

删除行:

 

read是我们已经设定好的该数据的变量,直接用read.drop的方式来删除相应的行。我们在括号中添加的是行的索引。。

删除列:

用drop的方式也可以删除列:

我们在drop后面先添加列的索引名称,然后在后面再添加一个参数,axis=1 , axis在英文翻译是“轴”的意思,在python中当axis这个参数后面等于0的时候,这个通常也是他的默认值,指的是对所有的行进行操作,如果当axis=1的时候,就是表示对所有的列进行操作。先行后列,先0后1.。

批量更改数据:

我们还可以通过切片的方式来批量对数据进行修改。

 

 

 

这个方式还可以通过这种操作把表格内所有符合条件的数据进行赋值。。


                                                                                         pandas关于索引基本就介绍到这里,如果以后有了新的感悟再来更新。

猜你喜欢

转载自blog.csdn.net/qq_42452134/article/details/82556707