DataFrame对象
DataFrame可以理解为一个由Series组成的字典,其中一列的名称为字典的键,Series为字典的值。一般可以直接通过字典或嵌套字典来构建DataFrame
1. 定义DataFrame对象
通过dict创建DataFrame,这里的color和object为columns名
>>> data = {'color': ['r', 'g', 'b'], 'object': ['ball', 'pen', 'pencil']}
>>> frame = pd.DataFrame(data)
>>> frame
color object
0 r ball
1 g pen
2 b pencil
也可以选择制定的列
>>> frame = pd.DataFrame(data, columns=['color'])
>>> frame
color
0 r
1 g
2 b
同时可以指定索引index=['', '', ...]
2. 选取元素
frame.columns //所有列的名称
frame.index //
frame.values //获取所有values
frame['color'] //单列
frame.color //单列
frame.ix[2] //单行
frame.ix[[2,4]] //多行
frame[2:4] //连续抽取多行
frame['color'][0] // 具体元素
3. 赋值
frame['price'] //修改列或新增列,可为具体值,或者Series
frame[' color'][0] = 'a' //修改具体元素
4. 元素的所属关系
frame.isin([1.0, 'r']) //可以是不同列的元素
5.删除一列
del frame['color']
6. 筛选
frame[ frame < 12]
7. 用嵌套字典生成DataFrame对象
>>> nestdict = {'red': {'a': 1, 'b': 2}, 'black': {'c': 3, 'd': 4}}
>>> frame = pd.DataFrame(nestdict)
>>> frame
red black
a 1.0 NaN
b 2.0 NaN
c NaN 3.0
d NaN 4.0
8. DataFrame转置
>>> frame.T
a b c d
red 1.0 2.0 NaN NaN
black NaN NaN 3.0 4.0