Python中pandas模块的使用方法

import pandas as pd

Python中pandas模块的讲解

Python运用于数据分析的简单教程: http://www.jb51.net/article/62982.htm

read_csv()

读写csv数据

df = pd.read_csv(path): 读入csv文件,形成一个数据框(data.frame)

df = pd.read_csv(path, header=None) 不要把第一行作为header

to_csv()

* 注意,默认会将第一行作为header,并且默认会添加index,所以不需要的话需要手动禁用 *

df.to_csv(path, header=False, index=False)

数据框操作

df.head(1) 读取头几条数据

df.tail(1) 读取后几条数据

df[‘date’] 获取数据框的date列

df.head(1)[‘date’] 获取第一行的date列

df.head(1)[‘date’][0] 获取第一行的date列的元素值

sum(df[‘ability’]) 计算整个列的和

df[df[‘date’] == ‘20161111’] 获取符合这个条件的行

df[df[‘date’] == ‘20161111’].index[0] 获取符合这个条件的行的行索引的值

df.iloc[1] 获取第二行

df.iloc[1][‘test2’] 获取第二行的test2值

10 mins to pandas
df.index 获取行的索引

df.index[0] 获取第一个行索引

df.index[-1] 获取最后一个行索引,只是获取索引值

df.columns 获取列标签

df[0:2] 获取第1到第2行,从0开始,不包含末端

df.loc[1] 获取第二行

df.loc[:,’test1’] 获取test1的那一列,这个冒号的意思是所有行,逗号表示行与列的区分

df.loc[:,[‘test1’,’test2’]] 获取test1列和test2列的数据

df.loc[1,[‘test1’,’test2’]] 获取第二行的test1和test2列的数据

df.at[1,’test1’] 表示取第二行,test1列的数据,和上面的方法类似

df.iloc[0] 获取第一行

df.iloc[0:2,0:2] 获取前两行前两列的数据

df.iloc[[1,2,4],[0,2]] 获取第1,2,4行中的0,2列的数据

(df[2] > 1).any() 对于Series应用any()方法来判断是否有符合条件的


原文:https://blog.csdn.net/Mrzhangjwei/article/details/53509040

猜你喜欢

转载自www.cnblogs.com/qbdj/p/11041252.html