pandas21 读csv文件read_csv(1.文本读写概要)(详细 tcy)

文本文件读写  

目录:
第1部分:csv文本文件读写
    
    pandas 读csv文件read_csv(1.文本读写概要)https://mp.csdn.net/postedit/85289371
    pandas 读csv文件read_csv(2.read_csv参数介绍)https://mp.csdn.net/postedit/85289928
    pandas 读csv文件read_csv(3.dtypes指定列数据类型)https://mp.csdn.net/postedit/85290575
    pandas 读csv文件read_csv(4.to_csv文本数据写)https://mp.csdn.net/postedit/85290962
    pandas 读csv文件read_csv(5.文本数据读写实例)https://mp.csdn.net/postedit/85291123
    pandas 读csv文件read_csv(6.命名和使用列)https://mp.csdn.net/postedit/85291430
    pandas 读csv文件read_csv(7.索引)https://mp.csdn.net/postedit/85291658
    pandas 读csv文件read_csv(8.方言和分隔符)https://mp.csdn.net/postedit/85291994
    pandas 读csv文件read_csv(9.浮点转换和NA值)https://mp.csdn.net/postedit/85292391
    pandas 读csv文件read_csv(10.注释和空行)https://mp.csdn.net/postedit/85292609
    pandas 读csv文件read_csv(11.日期时间处理) https://mp.csdn.net/postedit/85292925
    pandas 读csv文件read_csv(12.迭代和块)https://mp.csdn.net/postedit/85293639
    pandas 读csv文件read_csv(13.read_fwf读固定宽度数据)https://mp.csdn.net/postedit/85294010
    
第2部分:
    pandas hdf文件读写简要https://mp.csdn.net/postedit/85294299
    pandas excel读写简要https://mp.csdn.net/postedit/85294545
    
第3部分:
    python中csv模块用法tcy https://mp.csdn.net/postedit/85228189
    pandas读csv文件read_csv错误解决办法7种https://mp.csdn.net/postedit/85228808
    pandas to_string用法https://mp.csdn.net/postedit/85294935

1.pandas 中IO工具                                                                 2018/12/25

Format Type

Data Description

Reader

Writer

text

CSV

read_csv

to_csv

text

JSON

read_json

to_json

text

HTML

read_html

to_html

text

Local clipboard

read_clipboard

to_clipboard

binary

MS Excel

read_excel

to_excel

binary

HDF5 Format

read_hdf

to_hdf

binary

Feather Format

read_feather

to_feather

binary

Parquet Format

read_parquet

to_parquet

binary

Msgpack

read_msgpack

to_msgpack

binary

Stata

read_stata

to_stata

binary

SAS

read_sas

 

binary

Python Pickle Format

read_pickle

to_pickle

SQL

SQL

read_sql

to_sql

SQL

Google Big Query

read_gbq

to_gbq

2.1下面重点介绍read_csv和to_csv文本读写  
pd.read_csv(filepath_or_buffer, sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None,
    squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None,
    true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None,
    keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False,
    infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False,
    chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"',
    quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None,
    error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False,
    low_memory=True, memory_map=False, float_precision=None)           # 读划界的数据

pd.read_table(filepath_or_buffer, sep='\t', ...)                       # 读划界的数据
pd.read_fwf(filepath_or_buffer, colspecs='infer', widths=None, **kwds) # 读固定宽度数据 

df.to_csv(path_or_buf=None, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True,
    index_label=None, mode='w', encoding=None, compression=None, quoting=None, quotechar='"',
    line_terminator='\n', chunksize=None, tupleize_cols=None, date_format=None, doublequote=True,
    escapechar=None, decimal='.')                                      # 写带分隔符数据
2.2函数的选项: 

1.索引:将一个或多个列当做返回的DataFrame处理,以及是否从文件、用户获取列名。
2.类型推断和数据转换: 包括用户定义值的转换、缺失值标记列表等。
3.日期解析:包括组合功能,比如将分散在多个列中的日期时间信息组合成结果中的单个列。
4.选代:支持对大文件进行逐块选代。
5.不规整数据问题:跳过一些行、页脚、注释或其他一些不重要的东西(比如由成千上万个逗号隔开的数值数据)

6.导入:

from io import StringIO
pd.io.common.StringIO  

3.查看文件数据:

!type file_data.csv #windows查看文件数据内容  

3.手工处理分隔符格式

   大部分存储在磁盘上的表格型数据都能用pandas.read_table进行加载。然而,有时还
是需要做一些手工处理。由于接收到含有畸形行的文件而使read_table出毛病的情况并
不少见。为了说明这些基本工具,看看csv文件

猜你喜欢

转载自blog.csdn.net/tcy23456/article/details/85289371
今日推荐