DataFrame数据结构
是pandas的基本数据,类似于excel表格形式的数据
DataFrame数据创建
使用pandas.DataFrame(data,index,dtype,columns)
data:可以是列表,数组或字典(np.array())
index:行索引,columns代表列索引
使用列表创建和数组创建方式一样:
a=[['张三',12,'男'],['小五',17,'男'],['如果',3,'女']]
b=pd.DataFrame(a,columns=['姓名','年龄','性别'])
print(b)
'''
姓名 年龄 性别
0 张三 12 男
1 小五 17 男
2 如果 3 女
'''
使用字典创建:
a={'姓名':['张三','李四','王五'],'年龄':[10,20,5],'性别':['man','female','male']}
b=pd.DataFrame(a)
print(b)
'''
姓名 年龄 性别
0 张三 10 man
1 李四 20 female
2 王五 5 male
'''
DataFrame对象属性
values:返回除了标题和索引的内容
shape:返回对象的数组形式,例如(3,2,3)
dtypes:返回每一列内容的数据类型
columns:返回对象的每一列的属性名称
ndim:返回对象的维数
size:返回共有几个元素
index:返回行索引值
a={'姓名':['张三','李四','王五'],'年龄':[10,20,5],'性别':['man','female','male']}
b=pd.DataFrame(a)
print(b.values);print('*'*15);print(b.dtypes)
print('?'*15);print(b.columns)
'''
[['张三' 10 'man']
['李四' 20 'female']
['王五' 5 'male']]
***************
姓名 object
年龄 int64
性别 object
dtype: object
???????????????
Index(['姓名', '年龄', '性别'], dtype='object')
'''