python数据分析之pandas(二)DataFrame对象

DataFrame对象

DataFrame可以理解为一个由Series组成的字典,其中一列的名称为字典的键,Series为字典的值。一般可以直接通过字典或嵌套字典来构建DataFrame

1. 定义DataFrame对象

通过dict创建DataFrame,这里的color和object为columns名

>>> data = {'color': ['r', 'g', 'b'], 'object': ['ball', 'pen', 'pencil']}
>>> frame = pd.DataFrame(data)
>>> frame
  color       object
0     r    ball
1     g     pen
2     b  pencil

也可以选择制定的列

>>> frame = pd.DataFrame(data, columns=['color'])
>>> frame
  color
0     r
1     g
2     b

同时可以指定索引index=['', '', ...]

2. 选取元素

frame.columns //所有列的名称

frame.index //

frame.values //获取所有values

frame['color'] //单列

frame.color //单列

frame.ix[2] //单行

frame.ix[[2,4]] //多行

frame[2:4] //连续抽取多行

frame['color'][0] // 具体元素

3. 赋值

frame['price'] //修改列或新增列,可为具体值,或者Series

frame[' color'][0] = 'a' //修改具体元素

4. 元素的所属关系

frame.isin([1.0, 'r']) //可以是不同列的元素

5.删除一列

del frame['color']

6. 筛选

frame[ frame < 12]

7. 用嵌套字典生成DataFrame对象

>>> nestdict = {'red': {'a': 1, 'b': 2}, 'black': {'c': 3, 'd': 4}}
>>> frame = pd.DataFrame(nestdict)
>>> frame
   red  black
a  1.0    NaN
b  2.0    NaN
c  NaN    3.0
d  NaN    4.0

8. DataFrame转置

>>> frame.T
         a    b    c    d
red    1.0  2.0  NaN  NaN
black  NaN  NaN  3.0  4.0
发布了127 篇原创文章 · 获赞 10 · 访问量 24万+

猜你喜欢

转载自blog.csdn.net/u012599545/article/details/104241598