pandas - 文件读取与存储

其他 2019-03-14 13:00:52 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/apollo_miracle/article/details/88395541

学习目标

了解Pandas的几种文件读取存储操作
应用CSV方式和HDF方式实现文件的读取和存储
应用：实现股票数据的读取存储

我们的数据大部分存在于文件当中，所以pandas会支持复杂的IO操作，pandas的API支持众多的文件格式，如CSV、SQL、XLS、JSON、HDF5。

注：最常用的HDF5和CSV文件

1 数据读取存储API

1.1 read_csv与to_csv

pandas.read_csv(filepath_or_buffer, sep =',' , delimiter = None)
- filepath_or_buffer：文件路径
- usecols：指定读取的列名，列表形式
DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)
- path_or_buf :string or file handle, default None
- sep :character, default ‘,’
- columns :sequence, optional
- mode:'w'：重写, 'a' 追加
- index:是否写进行索引
- header :boolean or list of string, default True,是否写进列索引值

# 读取文件
data = pd.read_csv("./data/stock_day/stock_day.csv", usecols=['open', 'close'])

data[:10].to_csv("./test.csv", columns=['open'], index=False, mode='a', header=False)

1.2 read_hdf与to_hdf

pandas.read_hdf(path_or_buf，key =None，** kwargs)

从h5文件当中读取数据
- path_or_buffer:文件路径
- key:读取的键
- mode:打开文件的模式
- return:Theselected object

close = pd.read_hdf("./data/stock_plot/day_close.h5")

a = close[['000001.SZ', '000002.SZ']]

a.to_hdf("./test.h5", key="x")
b = pd.read_hdf("./test.h5", key="x")

如果读取的时候出现以下错误

需要安装安装tables模块避免不能读取hdf文件

pip install tables

2 拓展

优先选择使用hdf文件存储

hdf在存储的是支持压缩，使用的方式是blosc，这个是速度最快的也是pandas默认支持的
使用压缩可以提磁盘利用率，节省空间
hdf还是跨平台的，可以轻松迁移到hadoop 上面

猜你喜欢

转载自blog.csdn.net/apollo_miracle/article/details/88395541

pandas - 文件读取与存储

pandas文件读取与存储

pandas 存储文件到MySQL 以及读取

【Python】Pandas科学计算（一）——基本文件读取与存储

python数据分析与挖掘（十九）--- Pandas文件读取与存储

数据分析之Pandas（六）文件读取与存储

pandas文件读取与存储(csv,excel,hdf5,json)

Pandas读取tsv文件

pandas读取文件

pandas读取json文件

pandas读取excel文件

pandas文件读取的问题

pandas读取csv文件

pandas文件读取

pandas 读取tsv文件

pandas读取xls文件

[Pandas] 读取Excel文件

【自用】 pandas 读取 CSV 文件

通过Pandas读取大文件

pandas文件写入读取操作

Pandas读取Excel 、CSV文件

Pandas 读取，写入csv文件

用pandas读取大文件

【Python】Pandas读取tsv文件

Pandas——读取csv,txt文件

Pandas读取txt/csv文件

Pandas基础之文件读取

pandas写入读取csv文件

02-pandas-读取文件

Python之Pandas超详细入门教程 -- 第四章 Pandas中文件读取与存储【基础篇】

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)