2021-12-09 Pandas—to_csv()写入函数参数详解

1. to_csv函数的参数

DataFrame.to_csv(path_or_buf=None, sep=’,’, na_rep=’’, float_format=None, columns=None, header=True, index=True, index_label=None, mode=‘w’, encoding=None, compression=‘infer’, quoting=None, quotechar=’"’, line_terminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal=’.’, errors=‘strict’)
**

2. 参数解释

参数名 参数类型 描述
path_or_buf 字符串或文件句柄 默认无文件路径或对象,如果没有提供,结果将返回为字符串。
sep 默认字符‘,’ 输出文件的字段分隔符。
na_rep 字符串,默认为 ‘’ 默认无文件路径或对象,如果没有提供,结果将返回为字符串。
float_format 字符串,默认为 None 小数点保留几位。
columns 序列,数组 可选列写入,要写入的字段列表。
header 字符串或布尔列表,默认为true 写出列名。如果给定字符串列表,则作为列名的别名。
index 布尔值,默认为Ture 写入行名称(索引)。
index_label 字符串或序列,或False,默认为None 如果需要,可以使用索引列的列标签。如果没有给出,且标题和索引为True,则使用索引名称。如果数据文件使用多索引,则应该使用这个序列。如果值为False,不打印索引字段。在R中使用index_label=False 更容易导入索引.。
mode 字符串,默认为"w" Python写模式,默认“w”。 r : 只能读, 必须存在, 可在任意位置读取。 w : 只能写, 可以不存在, 必会擦掉原有内容从头写。 a : 只能写, 可以不存在, 必不能修改原有内容, 只能在结尾追加写, 文件指针无效。 r+ : 可读可写, 必须存在, 可在任意位置读写, 读与写共用同一个指针。 w+ : 可读可写, 可以不存在, 必会擦掉原有内容从头写。 a+ : 可读可写, 可以不存在, 必不能修改原有内容, 只能在结尾追加写, 文件指针只对读有效 (写操作会将文件指针移动到文件尾)。
encoding 字符串,可选 编码格式,表示在输出文件中使用的编码的字符串,Python2默认为“ASCII”,Python3默认为“UTF-8”。encoding=‘gbk’,encoding='utf_8_sig’可解决中文乱码的问题。
compression 字符串,可选项 表示在输出文件中使用的压缩的字符串,允许值为“gzip”、“bz2”、“xz”,仅在第一个参数是文件名时使用。
line_terminator 字符串,默认为 ‘\n’ 在输出文件中使用的换行字符或字符序列。默认为os.linesep,这取决于调用此方法的操作系统(例如,对于linux为“n”,对于Windows为“rn”)
quoting CSV模块的可选常量 默认值为to_csv.QUOTE_MINIMAL。如果设置了浮点格式,那么浮点将转换为字符串,因此csv.QUOTE_NONNUMERIC会将它们视为非数值的。
quotechar 字符串(长度为1),默认“” 用于引用字段的字符
doublequote 布尔,默认为Ture 引用路径在双引号内
escapechar 字符串(长度为1),默认为None 在适当的时候用来转义sep和quotechar的字符
chunksize int或None 一次写入行
date_format 字符串,默认为None 日期时间对象的格式字符串
decimal 字符串,默认’。’ 识别为十进制分隔符的字符。欧洲数据使用 ​​’,’
errors 字符串。 指定如何处理编码和解码错误

**

猜你喜欢

转载自blog.csdn.net/qq_15845559/article/details/121809127