csv和txt文件读取
read_csv 默认分隔符为逗号
read_table 默认分隔符为制表符
两者参数相同
文件路径中有中文需要加open
i = pd.read_csv(open('path'))
i = pd.read_csv(open('path'),sep=',') 可以指定分割符 这里指定为逗号
1、指定列作为索引
参数 index_col
i=pd.read_csv(open('path'),index_col='id') 指定文件中id列为索引
2、标题行进行设置
如果文件没有标题行
参数 header
分配默认标题行
参数names
指定 标题行(列名)
i=pd.read_csv(open('path'),hander=None)
i=pd.read_csv(open('path'),names=['id','name'])
3、自定义读取
参数 skiprows
跳过一些行
i=pd.read_csv(open('path'),skiprows=[0,5])
参数 nrows
选择读部分数据(行)
参数 usecols
选择读取指定行
i=pd.read_csv(open('path'),nrows=[10]) 读取10行
i=pd.read_csv(open('path'),usercols=['id','name']) 读取指定列
4、读取大文件
参数info
查看文件数据有多少
i=pd.read_csv(open('path'))
i.info()
参数chunksize 选择读取数据块大小
i=pd.read_csv(open('path'),chunksize=100)
i 返回的是可迭代的textfilereader。
5、文件存储
函数 to_csv 参数 sep指定存储分隔符
i=to_csv('path',sep=',')
6、查看文件内容
windows :
!type path
unix:
!cat path