python的pandas库读取csv

首先建立test.csv原始数据,内容如下

时间,地点
一月,北京
二月,上海
三月,广东
四月,深圳
五月,河南
六月,郑州
七月,新密
八月,大连
九月,盘锦
十月,沈阳
十一月,武汉
十二月,南京

导出pandas

import pandas as pd
csv=pd.read_csv('test.csv')
print(len(csv))  #结果是12,证明length是csv的列数

参数sep:str, default ‘,’ 指定分隔符。如果不指定参数,默认使用逗号分隔。

usecols : array-like, default None 返回一个数据子集,该列表中的值必须可以对应到文件中的位置(数字可以对应到指定的列)或者是字符传为文件中的列名。例如:usecols有效参数可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。使用这个参数可以加快加载速度并降低内存消耗。

csv1=pd.read_csv('test.csv',sep=',',usecols=[0,1])

上述代码输出结果

     时间  地点
0    一月  北京
1    二月  上海
2    三月  广东
3    四月  深圳
4    五月  河南
5    六月  郑州
6    七月  新密
7    八月  大连
8    九月  盘锦
9    十月  沈阳
10  十一月  武汉
11  十二月  南京
csv2=pd.read_csv('test.csv',sep=',',usecols=[0])

上述代码输出结果

     时间
0    一月
1    二月
2    三月
3    四月
4    五月
5    六月
6    七月
7    八月
8    九月
9    十月
10  十一月
11  十二月

csv=pd.read_csv('test.csv',sep=',',usecols=[0,1])
print(csv[0:1])
print('--------------')
print(csv[1:3])

上述代码输出结果

时间 地点
0 一月 北京
--------------
时间 地点
1 二月 上海
2 三月 广东

可见pandas将第一行数据当作表头,不算做正式数据里。方括号里的两个数字表示从第几行到第几行

print(csv[0:2]['时间'])

上述代码运行结果

0    一月
1    二月
Name: 时间, dtype: object
print(csv[0:2]['时间'].values[0])

上述代码运行结果

一月

可以看出从方括号里引用的某几行数据可以根据表头单独输出,并可以选择特定一行的值输出

 

猜你喜欢

转载自www.cnblogs.com/roadwide/p/10293040.html