数据分析模块之pandas

一.Series函数

导入Series函数

from pandas import Series

创建:

#index指定索引名称,默认0,1,2,3....,默认就是一列
Series([1,2,3,4,5],index=['a','b','c','d','e'])

索引操作:

a['a']
a[1]


a.head(4)
a.tail(3)

#去重
s = Series([1,1,1,1,2])
s.unique()

pd.isnull() ,pd.notnull():

s2 = Series([2,4,4])
s = s + s2
#检测空值
s.notnull()
#数据清洗,去除NAN值
s[s.notnull()]

二.DataFrame函数

#dataFrame是由Series组成的
#dataFrame是一个表格

from pandas import DataFrame

DataFrame(data=np.random.randint(0,100,size=(3,4)),index=['a','b','c'],columns=['A','B','C','D'])

df.values  #查看数值
df.columns  #列名
df.index   #行索引
df.shape   #几行几列

由字典创建DataFrame:

dic = {
    
    
    '张三':[50,50,30,20],
    '李四':[10,10,10,10]
}
df = DataFrame(data=dic,index=['语文','数学','英文','理综'])
df

在这里插入图片描述
列取值

#对列进行取值,由series构成
df['张三']
#取多列
df[['张三','李四']]

行取值

#显示索引
df.loc['语文']
#隐式索引
df.iloc[0]
#取多行
df.iloc[[0,1]]
#取多列
df.iloc[:,0:2]

#取某个数值
df['张三']['语文']
df.loc['英文','张三']
#取多列
df.loc[['语文','数学'],'李四']

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_37369726/article/details/116928291