pandas21 读csv文件read_csv（1.文本读写概要）（详细 tcy）

文本文件读写

目录：
第1部分：csv文本文件读写
    
    pandas 读csv文件read_csv（1.文本读写概要）https://mp.csdn.net/postedit/85289371
    pandas 读csv文件read_csv（2.read_csv参数介绍）https://mp.csdn.net/postedit/85289928
    pandas 读csv文件read_csv（3.dtypes指定列数据类型）https://mp.csdn.net/postedit/85290575
    pandas 读csv文件read_csv（4.to_csv文本数据写）https://mp.csdn.net/postedit/85290962
    pandas 读csv文件read_csv（5.文本数据读写实例）https://mp.csdn.net/postedit/85291123
    pandas 读csv文件read_csv（6.命名和使用列）https://mp.csdn.net/postedit/85291430
    pandas 读csv文件read_csv（7.索引）https://mp.csdn.net/postedit/85291658
    pandas 读csv文件read_csv（8.方言和分隔符）https://mp.csdn.net/postedit/85291994
    pandas 读csv文件read_csv（9.浮点转换和NA值）https://mp.csdn.net/postedit/85292391
    pandas 读csv文件read_csv（10.注释和空行）https://mp.csdn.net/postedit/85292609
    pandas 读csv文件read_csv（11.日期时间处理） https://mp.csdn.net/postedit/85292925
    pandas 读csv文件read_csv（12.迭代和块）https://mp.csdn.net/postedit/85293639
    pandas 读csv文件read_csv（13.read_fwf读固定宽度数据）https://mp.csdn.net/postedit/85294010
    
第2部分：
    pandas hdf文件读写简要https://mp.csdn.net/postedit/85294299
    pandas excel读写简要https://mp.csdn.net/postedit/85294545
    
第3部分：
    python中csv模块用法tcy https://mp.csdn.net/postedit/85228189
    pandas读csv文件read_csv错误解决办法7种https://mp.csdn.net/postedit/85228808
    pandas to_string用法https://mp.csdn.net/postedit/85294935

1.pandas 中IO工具 2018/12/25

Format Type	Data Description	Reader	Writer
text	CSV	read_csv	to_csv
text	JSON	read_json	to_json
text	HTML	read_html	to_html
text	Local clipboard	read_clipboard	to_clipboard
binary	MS Excel	read_excel	to_excel
binary	HDF5 Format	read_hdf	to_hdf
binary	Feather Format	read_feather	to_feather
binary	Parquet Format	read_parquet	to_parquet
binary	Msgpack	read_msgpack	to_msgpack
binary	Stata	read_stata	to_stata
binary	SAS	read_sas
binary	Python Pickle Format	read_pickle	to_pickle
SQL	SQL	read_sql	to_sql
SQL	Google Big Query	read_gbq	to_gbq

2.1下面重点介绍read_csv和to_csv文本读写

pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None,
    squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None,
    true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None,
    keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False,
    infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False,
    chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"',
    quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None,
    error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False,
    low_memory=True, memory_map=False, float_precision=None)           # 读划界的数据

pd.read_table(filepath_or_buffer, sep='\t', ...)                       # 读划界的数据
pd.read_fwf(filepath_or_buffer, colspecs='infer', widths=None, **kwds) # 读固定宽度数据 

df.to_csv(path_or_buf=None, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True,
    index_label=None, mode='w', encoding=None, compression=None, quoting=None, quotechar='"',
    line_terminator='\n', chunksize=None, tupleize_cols=None, date_format=None, doublequote=True,
    escapechar=None, decimal='.')                                      # 写带分隔符数据

2.2函数的选项： 

1.索引：将一个或多个列当做返回的DataFrame处理，以及是否从文件、用户获取列名。
2.类型推断和数据转换： 包括用户定义值的转换、缺失值标记列表等。
3.日期解析：包括组合功能，比如将分散在多个列中的日期时间信息组合成结果中的单个列。
4.选代：支持对大文件进行逐块选代。
5.不规整数据问题：跳过一些行、页脚、注释或其他一些不重要的东西（比如由成千上万个逗号隔开的数值数据）

6.导入：

from io import StringIO
pd.io.common.StringIO

3.查看文件数据：

!type file_data.csv #windows查看文件数据内容

3.手工处理分隔符格式

   大部分存储在磁盘上的表格型数据都能用pandas.read_table进行加载。然而，有时还
是需要做一些手工处理。由于接收到含有畸形行的文件而使read_table出毛病的情况并
不少见。为了说明这些基本工具，看看csv文件

pandas21 读csv文件read_csv（1.文本读写概要）（详细 tcy）

猜你喜欢