python数据结构:pandas(3)

 一、pandas数据操作:

  1.处理缺失数据

    (1)判断是否存在缺失值

      ser_obj.isnull(),df_obj.isnull()

    (2)dropna:丢弃缺失数据

    (3)fillna:填充缺失值

  2.常用的统计计算

import numpy as np
import pandas as pd
df1 =pd.DataFrame(np.random.randn(5,4),columns=['a','b','c','d'])
print(df1)

    (1)sum,mean,max,min.......

    (2)axis=0按照列统计,axis=0按照行进行统计

#求和,求出各列的最大值,默认是axis=的方向
print('df1.sum=\n',df1.sum())
#打印出df1的最大值,求出df1各列的最大值
print('df1.max()=\n',df1.max())
求出水平方向各列的最大值
print('水平方向的最大值=\n',df1.max(axis=1))

#求出水平方向各行的和
print('水平方向各行的和',df1.sum(axis=1))
print('各个值的描述为:\n',df1.describe())

    (3)skipna排除缺失值,默认为True

    (4)idmax,idmin,cumsum

    (5)describe()描述多个数据

二、pandas层级索引

  

猜你喜欢

转载自www.cnblogs.com/bigdata-stone/p/10224786.html