pandas IO操作

csv和txt文件读取

read_csv    默认分隔符为逗号
read_table  默认分隔符为制表符
两者参数相同

文件路径中有中文需要加open

i = pd.read_csv(open('path'))
i = pd.read_csv(open('path'),sep=',') 可以指定分割符 这里指定为逗号

1、指定列作为索引

参数 index_col

i=pd.read_csv(open('path'),index_col='id') 指定文件中id列为索引

2、标题行进行设置

如果文件没有标题行
参数 header 分配默认标题行
参数names指定 标题行(列名)

i=pd.read_csv(open('path'),hander=None) 
i=pd.read_csv(open('path'),names=['id','name']) 

3、自定义读取

参数 skiprows 跳过一些行

i=pd.read_csv(open('path'),skiprows=[0,5])

参数 nrows 选择读部分数据(行)
参数 usecols 选择读取指定行

i=pd.read_csv(open('path'),nrows=[10]) 读取10行
i=pd.read_csv(open('path'),usercols=['id','name']) 读取指定列

4、读取大文件

参数info查看文件数据有多少

i=pd.read_csv(open('path'))
i.info() 

参数chunksize 选择读取数据块大小

i=pd.read_csv(open('path'),chunksize=100)
i      返回的是可迭代的textfilereader。

5、文件存储

函数 to_csv   参数 sep指定存储分隔符 
i=to_csv('path',sep=','

6、查看文件内容

windows :
!type path
unix:
!cat path

发布了53 篇原创文章 · 获赞 3 · 访问量 1572

猜你喜欢

转载自blog.csdn.net/weixin_45427650/article/details/105338007