文件读取与存储 - 代码天地

文件读取与存储

其他 2019-09-08 22:04:35 阅读次数: 0

pandas的API支持众多的文件格式，如CSV、SQL、XLS、JSON、HDF5。

CSV

pandas.read_csv(filepath_or_buffer, sep =',' )
- filepath_or_buffer:文件路径
- usecols:指定读取的列名，列表形式
- sep-分割字符默认','

# 读取文件,并且指定只获取'open', 'close'指标
data = pd.read_csv("./data/stock_day.csv", usecols=['open', 'close'])

to_csv
- DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, mode='w', encoding=None)
  - path_or_buf :string or file handle, default None
  - sep :character, default ‘,’
  - columns :sequence, optional
  - mode:'w'：重写, 'a' 追加
  - index:是否写进行索引
  - header :boolean or list of string, default True,是否写进列索引值

HDF5

HDF5文件的读取和存储需要指定一个键，值为要存储的DataFrame

从h5文件当中读取数据

pandas.read_hdf(path_or_buf，key =None，** kwargs)
- path_or_buffer:文件路径
- key:读取的键
- return:Theselected object
DataFrame.to_hdf(path_or_buf, key, \kwargs)
- key:指定保存的键名

JSON

read_json—读取文件
- orient--指定读取数据的字典格式
- records—一行一个记录{列名:值,}
- lines—是否分行--一个记录一行
DataFrame.to_json(path_or_buf=None, orient=None, lines=False)
- 将Pandas 对象存储为json格式
- path_or_buf=None：文件地址
- orient:存储的json形式，{‘split’,’records’,’index’,’columns’,’values’}
- lines:一个对象存储为一行
to_json--存储文件—注意:lines=True

优先选择使用HDF5文件存储

HDF5在存储的时候支持压缩，使用的方式是blosc，这个是速度最快的也是pandas默认支持的
使用压缩可以提磁盘利用率，节省空间
HDF5还是跨平台的，可以轻松迁移到hadoop 上面

猜你喜欢

转载自www.cnblogs.com/oklizz/p/11488677.html

TFRecords文件的存储与读取

Python 文件读取与存储

pandas - 文件读取与存储

Android的文件读取与存储

文件读取与存储

pandas文件读取与存储

文件的读取、存储及异常处理

Python读取文件内容与存储

读取、写入文件、存储数据

文件读取/数据存储-6

文件读取与存储工具类

Springboot集成MongoDB存储文件、读取文件

Android的文件存储（写入和读取）

InfluxDB存储引擎—— TSI文件与数据读取

Tensorflow基础0：文件的读取与存储

pandas 存储文件到MySQL 以及读取

TFRecords文件的存储与读取讲解及代码实现

Android 文件IO流的存储和读取

Django实现文件在本地的存储和读取

数据获取_json文件读取和存储

Android之简单文件存储读取

读取excel文件并以对象存储

JAVA使用Jedis操作Redis存储文件并读取文件内容

二进制数据存储、读取；TXT或CSV格式文件的存储、读取（savetxt、loadtxt）

Unity 配置表读取-数据存储-基于NPOI读取Excel文件转cs文件-xlsx文件读取

Android五种数据存储方式之文件存储内部存储外部存储文件读取保存操作封装

Android数据存储之文件存储（瞬时数据的存储与读取）项目已上传GitHub

使用mongodb对文件(图片、音频、视频)的存储、读取操作

getServletContext和getServletConfig的getInitParameter方法(读取文件存储地址)

C#创建.txt文件存储和读取数据的问题

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)