使用pandas

import pandas as pd


它主要的数据结构有如下两种:


Series


Series类似于一维数组对象,它由一组数据以及一组与之相关的数据标签组成,简单的Series可以按下面的方式进行创建:



obj=pd.Series([4,7,5,3])

其中,第一列是Series的索引列(index),第二列是数值列(values)。
DataFrame


DataFrame是一个表格型的数据结构,既有行索引又有列索引。行索引称为index,标示每一行数据,列索引称为columns,标示每一列数据。可以简单理解为一个数据表,列索引为数据表中除主键外的一个个字段,行索引相当于数据表中每一条数据的主键值。通过dict来创建DataFrame可以按如下的方式:

data={
'state':['Ohio','Ohio','Ohio','Nevada','Nevada'],
'year':[2001,2001,2002,2001,2002],
'pop':[1.5,1.7,3.6,2.4,2.9]
}
frame=pd.DataFrame(data)

如果不指定索引,结果中会自动加入行索引,而dict中的key则将作为列索引,输出如下:



猜你喜欢

转载自blog.csdn.net/taojiea1014/article/details/80186468