【Python】Pandas 速查手册

本文转载至文章:Pandas速查手册中文版  ,我添加了个人使用的案例说明,以及一些 DataFrame 的结构解释。

Pandas 是一个很重要的包,能够非常方便的处理结构化的数据,比如我就很喜欢用它来处理一些 excel 和 csv 的文档。如果你想学习 Pandas ,建议先看俩个网站:

导入数据:

  • pd.read_csv(filename):从CSV文件导入数据
  • pd.read_table(filename):从限定分隔符的文本文件导入数据
  • pd.read_excel(filename):从Excel文件导入数据
  • pd.read_sql(query, connection_object):从SQL表/库导入数据
  • pd.read_json(json_string):从JSON格式的字符串导入数据
  • pd.read_html(url):解析URL、字符串或者HTML文件,抽取其中的tables表格
  • pd.read_clipboard():从你的粘贴板获取内容,并传给read_table()
  • pd.DataFrame(dict):从字典对象导入数据,Key是列名,Value是数据

CSV和EXCEL:

excel文件和 csv 文件的区别在于前者有分页(sheet),而且用文档编辑器打开的话会发现 excel 一行之间的单元格是以英文逗号 "," 结尾,而 csv 是以制表 “\t” 结尾。注意一点的是,并不是所有得到文件其内容都很规范,比如在一个单元格里面有一大段句子含有英文逗号,就会导致生成 DataFrame 出现问题。所以在导入 Python 中进行处理的时候有必要在 excel 中预查看一下。

import pandas as pd
def xlsx_to_csv_pd():      #读取excel实例
    data_xls = pd.read_excel("test.xlsx",index_col=0 )
    data_xls.to_csv("test.csv",encoding="utf-8")

猜你喜欢

转载自www.cnblogs.com/guangluwutu/p/11956350.html