数据分析笔记--pandas的数据结构--Series和DataFrame

import pandas as pd

Series对象的创建

Series对象包括两个部分,索引和数据

可以通过列表或者其他序列来创建


通过head()可以只显示头部几个,比如前五个


.value和.index用来获取Series对象的数据和索引

.values返回的是numpy的ndarray类型的数组


通过索引来获取数据


通过字典来构建Series,字典的键将会作为他的行索引,字典的值作为数据



我们还可以通过.name给Series对象以及他的索引起别名


DataFrame对象的创建

1,通过二维数组创建DataFrame对象


2,通过字典创建DataFrame对象


由字典生成DataFrame对象的话, 字典的键会生成列索引,行索引会自动生成,行数会以字典中值最长的元素决定,不足此长度的列会以重复的行来进行补齐

但是如果想补齐列表或者数组这种值是会报错的:

如下“D”的元素个数有五个,“E”列表的元素个数为四个,当对这种形式的字典进行DataFrame转换时,由于列表的个数固定了,无法补齐,将会报出以下的错误


3,通过索引获取列

可以用以下两种方式

4,取出某个具体的数据,先取列索引,再取行索引,就能取出具体值了


5,增加新的列数据,可以通过原先的列创建新的列或者直接创建新的列


6.删除一列数据




猜你喜欢

转载自blog.csdn.net/print_and_return/article/details/80434750
今日推荐