python的pandas库读取csv

首先建立test.csv原始数据，内容如下

时间,地点
一月,北京
二月,上海
三月,广东
四月,深圳
五月,河南
六月,郑州
七月,新密
八月,大连
九月,盘锦
十月,沈阳
十一月,武汉
十二月,南京

导出pandas

import pandas as pd

csv=pd.read_csv('test.csv')
print(len(csv))　　#结果是12，证明length是csv的列数

参数sep：str, default ‘,’ 指定分隔符。如果不指定参数，默认使用逗号分隔。

usecols : array-like, default None 返回一个数据子集，该列表中的值必须可以对应到文件中的位置（数字可以对应到指定的列）或者是字符传为文件中的列名。例如：usecols有效参数可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。使用这个参数可以加快加载速度并降低内存消耗。

csv1=pd.read_csv('test.csv',sep=',',usecols=[0,1])

上述代码输出结果

     时间  地点
0    一月  北京
1    二月  上海
2    三月  广东
3    四月  深圳
4    五月  河南
5    六月  郑州
6    七月  新密
7    八月  大连
8    九月  盘锦
9    十月  沈阳
10  十一月  武汉
11  十二月  南京

csv2=pd.read_csv('test.csv',sep=',',usecols=[0])

上述代码输出结果

     时间
0    一月
1    二月
2    三月
3    四月
4    五月
5    六月
6    七月
7    八月
8    九月
9    十月
10  十一月
11  十二月

csv=pd.read_csv('test.csv',sep=',',usecols=[0,1])
print(csv[0:1])
print('--------------')
print(csv[1:3])

上述代码输出结果

时间地点
0 一月北京
--------------
时间地点
1 二月上海
2 三月广东

可见pandas将第一行数据当作表头，不算做正式数据里。方括号里的两个数字表示从第几行到第几行

print(csv[0:2]['时间'])

上述代码运行结果

0    一月
1    二月
Name: 时间, dtype: object

print(csv[0:2]['时间'].values[0])

上述代码运行结果

一月

可以看出从方括号里引用的某几行数据可以根据表头单独输出，并可以选择特定一行的值输出

python的pandas库读取csv

猜你喜欢