本文测试使用Pandas使用的是Spyder,python3.6版本,已经安装好pandas包。
序列:Series
用于存储一行或者一列的数据,以及与之相关的索引集合(类似于列表,但是有索引)
数据定义:
#序列的导入
from pandas import Series
#定义,可以混合定义
x=Series(['a',True,1],index=['first','second','third'])
在Variable explorer中点击x可查看数据如下图:
如果在定义的时候不设置index时,会自动设置(默认),如下图:
#序列的导入
from pandas import Series
#定义,可以混合定义
x=Series(['a',True,1],index=['first','second','third'])
x=Series(['a',True,1])
访问方式:
在设置索引index
的时候,可以同时使用:x[1]
(表示获默认索引为1的数据)以及x["first"]
(索引为first的数据)。在不设置索引的时候,只能通过默认索引的方式获取。(注:当使用索引的方式不要使用索引超过数据的长度的值,否则会出现 index out of bounds错误)。
数据追加:
不能形如x.append('3')
的形式追加,需要追加一个序列,形如x=x.append(Series(['3']))
,需要用原来的序列来接受。如果没有设置索引,那么就会默认从0开始自动设置索引(需要注意的是,再次x=x.append(Series(['3']))
其索引依然为0)如图:
常用方法:
判断值是否存在于其中:不应使用'3' in x
,应使用'3' in x.values
切片:(类似于列表的方式)如:x[1:3]
获取的值为索引为1和2,不包括3.
定位获取:(可用于随机抽样)如x[[2,1,0]]
结果如下图:
数据删除:根据默认索引或者设置的索引如:x.drop(0)
或x.drop("first")
,并用x去接收数据;根据位置删除,x.drop(x.index[3])
删除索引为3值(x.index[3]
通过默认索引获取设置索引的值);根据值删除:如z=x['3'!=x.values]
,获取序列中值不为3的新序列,如图:
数据的遍历:
for index in x.index:
#索引的遍历
print("x的索引:",index)
#值得遍历
print("x的值:",x[index])