1.pandas基础知识
- Pandas 是第三库,提供高性能易用数据类型和分析工具。Pandas基于Numpy实现,参与NumpyyuMa与Matplotlib一同使用。
import pandas as pd
- Pandas提供两个数据类型:Series一维,DataFrame二维与多维数据类型。基于上述数据提供各类基本操作、运算操作、特征类操作、关联类操作
- Numpy 基础数据类型ndarray;关注数据的结构表达;维度:数据间关系
- Pandas扩展数据类型;关注数据的应用表达;数据与索引间关系
2.Series
- Series 类型由一组数据及之相关的数据索引组成,自动索引和数据类型,自定义索引
- Series类型创建:*python列表 *标量值 *python字典 *ndarray 其他函数
标量值创建
import pandas as pd
s=pd.Series(25,index=['a','b','c']) 索引不能省略
print(s)
* 从字典类型创建d=pd.Series({'a':9,'b':8,'c':7})
,index从字典中进行选择操作
* 从ndarray类型创建n=pd.Series(np.arange(5))
print(n)
m=pd.Series(np.arange(5),index=np.arange(9,4,-1))
print(m)