1.1 数据结构介绍
1、pandas介绍
1. 在pandas中有两类非常重要的数据结构,即序列Series和数据框DataFrame。
2. Series类似于numpy中的一维数组,除了通吃一维数组可用的函数或方法,而且其可通过索引标签的方式获取数据,还具有索引的自动对齐功能;
3. DataFrame类似于numpy中的二维数组,同样可以通用numpy数组的函数和方法,而且还具有其他灵活应用,后续会介绍到。
2、Series创建的三种方式
1、通过一维数组创建序列
import numpy as np, pandas as pd arr1 = np.arange(10) print arr1,type(arr1) # [0 1 2 3 4 5 6 7 8 9] <type 'numpy.ndarray'> s1 = pd.Series(arr1) print s1,type(s1) # 0 0 # 1 1 # 2 2 # 3 3 # 4 4 # 5 5 # 6 6 # 7 7 # 8 8 # 9 9 # dtype: int64 <class 'pandas.core.series.Series'>