一.Series函数
导入Series函数
from pandas import Series
创建:
#index指定索引名称,默认0,1,2,3....,默认就是一列
Series([1,2,3,4,5],index=['a','b','c','d','e'])
索引操作:
a['a']
a[1]
a.head(4)
a.tail(3)
#去重
s = Series([1,1,1,1,2])
s.unique()
pd.isnull() ,pd.notnull():
s2 = Series([2,4,4])
s = s + s2
#检测空值
s.notnull()
#数据清洗,去除NAN值
s[s.notnull()]
二.DataFrame函数
#dataFrame是由Series组成的
#dataFrame是一个表格
from pandas import DataFrame
DataFrame(data=np.random.randint(0,100,size=(3,4)),index=['a','b','c'],columns=['A','B','C','D'])
df.values #查看数值
df.columns #列名
df.index #行索引
df.shape #几行几列
由字典创建DataFrame:
dic = {
'张三':[50,50,30,20],
'李四':[10,10,10,10]
}
df = DataFrame(data=dic,index=['语文','数学','英文','理综'])
df
列取值
#对列进行取值,由series构成
df['张三']
#取多列
df[['张三','李四']]
行取值
#显示索引
df.loc['语文']
#隐式索引
df.iloc[0]
#取多行
df.iloc[[0,1]]
#取多列
df.iloc[:,0:2]
#取某个数值
df['张三']['语文']
df.loc['英文','张三']
#取多列
df.loc[['语文','数学'],'李四']