一、pandas数据操作:
1.处理缺失数据
(1)判断是否存在缺失值
ser_obj.isnull(),df_obj.isnull()
(2)dropna:丢弃缺失数据
(3)fillna:填充缺失值
2.常用的统计计算
import numpy as np import pandas as pd df1 =pd.DataFrame(np.random.randn(5,4),columns=['a','b','c','d']) print(df1)
(1)sum,mean,max,min.......
(2)axis=0按照列统计,axis=0按照行进行统计
#求和,求出各列的最大值,默认是axis=的方向 print('df1.sum=\n',df1.sum()) #打印出df1的最大值,求出df1各列的最大值 print('df1.max()=\n',df1.max())
求出水平方向各列的最大值
print('水平方向的最大值=\n',df1.max(axis=1))
#求出水平方向各行的和
print('水平方向各行的和',df1.sum(axis=1))
print('各个值的描述为:\n',df1.describe())
(3)skipna排除缺失值,默认为True
(4)idmax,idmin,cumsum
(5)describe()描述多个数据