DataFrame是一个【表格型】的数据结构。
DataFrame由按一定顺序排列的多列数据组成。
设计初衷是将Series的使用场景从一维拓展到多维。
DataFrame既有行索引,也有列索引。
行索引:index
列索引:columns
值:values
1)DataFrame的创建
dic = { 'lucy':[100,19,87,90,11,56], 'tom':[89,99,93,56,80,100]}
DataFrame(data=dic)
DataFrame(data=dic,index=list('ABCDEF'))
DataFrame(data=dic,index=list('ABCDEF'),columns=['java','c++'])
score_arr=np.random.randint(50,100,size=[2,3])
DataFrame(data=score_arr,index=['java','python'],columns=['张三','李四','王五'])
2)DataFrame的索引
1.对列进行索引
- 通过类似字典的方式 df['q']
- 通过属性的方式 df.q
2.对行进行索引
- 使用.loc[]加index来进行行索引
- 使用.iloc[]加整数来进行行索引
3.对元素索引的方法
- 使用列索引
- 使用行索引(iloc[3,1] or loc['C','q']) 行索引在前,列索引在后