python数据分析之pandas（7）数据读写

其他 2020-02-27 22:27:01 阅读次数: 0

pandas提供各种I/O API函数，这里把一些常用的方式分享给大家。

1.读写csv文件

frame = read_csv('a.csv')

//返回DataFrame对象，相关参数如:

names=['','']  指定表头; 

header=None  使用默认表头;

index_col=['color', 'status']，给前2列设置为层级索引

frame.to_csv('a.csv') //保存到csv文件中，相关参数：

index=False //无索引
header=False
na_rep='NaN' //将空字段替换为NaN字符串，可以是其它值

2.读txt文件

frame = read_table('a.txt', sep='\s*') //以空白字符分割，相关参数：

skiprows=5 //排除前5行,可简写为n=5，skiprows=[5]只排除第5行，skiprows=[1,3,4] //指定行
nrows=3 //从起始往后读多少行
chunksize=3 //逐块读取

3.读写Excel文件

frame = pd.read_excel('a.xls', 'Sheet2')，//默认读第一张表，这里设置为第二张，同样可以设置index和columns参数

4.json数据

>>> import pandas as pd
>>> frame = pd.DataFrame()
>>> import numpy as np
>>> frame = pd.DataFrame(np.arange(4).reshape(2,2),index=['white', 'black'],colu
mns=['up', 'down'])
>>> frame
       up  down
white   0     1
black   2     3
>>> frame.to_json('frame.json')
>>> frame = pd.read_json('frame.json')
>>> frame
       down  up
black     3   2
white     1   0
>>>

可以看出，通过DataFrame对json进行管理还是很方便的

5.HDF5格式

hdf5效率高，使用很广，一般用法如下：

>>> from pandas.io.pytables import HDFStore
>>> store = HDFStore('mydata.h5')
>>> store['obj1'] = frame

注意，需要依赖tables

6.cPickle

cPickle是pickle的优化版，速度快很多

import cPickle as pickle
data = {'a': 'b'}
pickled_data = pickle.dumps(data) //序列化
nframe = pickle.loads(pickled_data) //重建

frame.to_pickle('frame.pkl')
pd.read_pickle('frame.pkl')

7.对接数据库

为各数据库提供统一接口

confiself

发布了127 篇原创文章 · 获赞 10 · 访问量 24万+

私信关注

猜你喜欢

转载自blog.csdn.net/u012599545/article/details/104320481

python数据分析之pandas（7）数据读写

Python数据分析库pandas ------ pandas数据读写

Python数据分析（4）pandas库的使用：数据的读写

Python数据分析之pandas学习

Python数据分析之pandas

Python数据分析之pandas入门

python数据分析之 pandas

Python数据分析之pandas的使用

python数据分析之pandas（一）

python（七）数据分析之pandas

Python数据分析之Pandas库

python 数据分析7 pandas数据输入与输出

7、Python 数据分析-Pandas人口分析案例

数据分析之pandas

python pandas数据分析

python 数据分析--pandas

Python数据分析-Pandas

数据矿工学习-Python数据分析之pandas

数据分析入门之python pandas数据导入与导出

python数据分析之pandas（12）数据聚合

python数据分析之pandas（10）数据转换

python数据分析之pandas（9）数据拼接

python数据分析之pandas（8）数据合并

7.python数据分析与展示------Pandas库入门

基于 Python 和 Pandas 的数据分析(7) --- Pickling

Python数据分析【第7天】| pandas.DataFrame

Python数据分析7——pandas时间序列

Python——第7章 pandas数据分析实战

Python数据分析之pandas学习 python数据分析入门学习笔记

【Python 数据分析】pandas数据导入

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)