如何用pandas读取和导入csv数据文件

       我们利用python进行数据分析时,pandas中的DataFrame数据结构是最基本最常用的,因此本文将说明如何利用pandas中的方法读取csv文件中的数据,以及如何把DataFrame对象的数据导入到csv文件中储存。

       关于导入数据,可以直接用DataFrame对象的to_csv方法,这个方法参数有很多,见图一。这里介绍三个重要参数:path_or_buf、mode、header,其中path_or_buf自然就是要导入的文件路径,mode默认为w,表示写入,但注意是清空文件的原数据再写入,因此如何我们每次写入是追加数据,那么可以把'w'改为'a',表示追加数据;header表示DataFrame对象的列名,默认为True,即写入列名,但是当我们是追加数据时,往往不再需要列名,这时可以设为False,只追加数据,不重复写入列名。

图一

       接下来是从csv文件读取数据,可以利用pandas的read_csv方法,同样的这个方法有很多的参数,使用也很灵活,本文不再做详细介绍,用户可以自己查看文档。但是这里笔者要起那个强调的是,这个方法默认的读取方式是把文件中的第一行作为列名,剩下的作为数据内容,并自设数字索引。因为to_csv的默认导入是把原DataFrame对象的index放在第一列的,所以如果是从这样的数据文件再次读取的话,那么原DataFrame中的index会变成新DataFrame对象的列,需要用户自己再重新设置一下index。

猜你喜欢

转载自blog.csdn.net/S_o_l_o_n/article/details/82837817