Cookbook:pandas的学习之路——10 Minutes to pandas

  按照pandas官网上10 Minutes to pandas的快速练习:

一 .对象创建:

导入练习所需要的工具包:

通过列表中的值创建序列Series,pandas在创建序列的同时会默认为列表中值创建索引:(np.nan 为空值)

通过NumPy数组创建DataFrame,同时默认创建时间索引和行标签:

np.random.randn(6,4) 介绍:从正太分布中返回一个或多个样本值 ,例子中表示返回6行4列的随机数,不一定在(0,1]之间

np.random.rand(6,4)介绍:从(0,1]之间,产生6行4列的嵌套数组)

通过将字典转化为类似序列Series的形式,创建DataFrame:

(pd.Categorical()函数:

 pandas.Categoricalvaluescategories = Noneordered = Nonedtype = Nonefastpath = False 

values:像列表一样,categories:类别,可以定义类别,ordered:是否有序,dtype:categ的类型)

DataFrame每一列的数据类型:

使用<tab>可自动补全列名,并获取指定列的值:

二.查看数据

查看frame的头部和底部的数据:

显示DataFrame的索引,列标题和值:

DataFram的函数describe(),快速分析汇总数据:

汇总指标:count:记数,mean:平均值,std:标准差,min:最小值,max:最大值

对DataFrame中的数据进行行列转换:

猜你喜欢

转载自www.cnblogs.com/maria-ld/p/9170740.html