目录
1.CSV与TSV
C:逗号分隔的结构化文件
T:制表符分隔的文件
关于CSV已经形成了一种惯性认识:只要是普通的文本文件,并且是结构化的
所以不管是什么分隔符,都是CSV格式
狭义上,必须是逗号
但是现在一般都把结构化的普通文本文件,用CSV的方式来对待,区别仅仅是改一下分隔符而已
2.read_csv()
参数:
- sep或delimiter指定分隔符,默认是逗号。
- header=None指定不把第一行记录当作列名。
- names定义列名,如果指定了header=None,不指定names,则默认列名是0,1,2…
- index_col把某列当作行索引,例如数据表中的主键。
- usecols在读取文件的时候只选择读取部分列。
导入数据:
2.1 header
2.2 names
或者在数据读取之后,使用columns指定列标题
2.3 index_col
2.3 usecol
3.to_csv()
参数:
- sep:指定分隔符,默认是逗号。
- header:是否写入标题行,默认True,写入。
- na_rep:空值如何表示,默认是’’。
- index:是否写入行索引,默认True,写入。
- index_label:行索引的名称,默认是None。
- columns:写入哪些列,默认全部列。
导入数据:
3.1 sep
3.2 header
默认写入列名,设置为False为不写入。
3.3 na_rep
空值使用了"空"字替代
3.4 index
默认写入行索引,设置为false不写入
3.5 index_label
默认没有行索引名称,如果设置header = False,则定义了行索引名称也不会显示,因为header = False是不写入标题。
3.6 columns
写入哪些列,默认所有列都写入。