我们全程使用Jupyter进行程序的编写
第一步
引入numpy和pandas库
import numpy as np
import pandas as pd
第二步
开始使用
对象创建
- (1)通过一列表的值创造一个序列,让pandas创造一个默认整型指数
s = pd.Series([1,3,5,np.nan,6,7])
s
- (2)基于NumPy数组创建一个带有日期指数和标签列的DataFrame
dates = pd.date_range('20200620',periods=6)
dates
- (3)通过对象字典创建一个转化为类似序列的DataFrame
df2 = pd.DataFrame(
{'A':1.,
'B':pd.Timestamp('20200620'),
'C':pd.Series(1,index=list(range(4)),dtype='float32'),
'D':np.array([3]*4,dtype='int32'),
'E': pd.Categorical(["test", "train", "test", "train"]),
'F': 'foo'})
df2
- (4)DataFrame的列有不同的dtypes
df2.dtypes
- (5)IPython支持 tab 键自动补全列名与公共属性。下面是部分可自动补全的属性:
df2.<TAB>