python--学习笔记7 文件格式、数据读取、储存 - 代码天地

python--学习笔记7 文件格式、数据读取、储存

其他 2019-01-18 18:17:59 阅读次数: 0

读取文本类数据

pandas提供了一些将表格型数据读取为DataFrame对象的函数。read_csv 默认分隔符为逗号， read_table 默认分隔符为制表符 "\t"

类型推断是这些函数最重要的功能之一。

没有标题行的文件可以通过pandas分配也可以自定义列名。 pd.read_csv('xxx.csv',header=None) / pd.read_csv('xxx.csv', names = ['a','b','c','d','message'])

可以通过index_col 指定索引 pd.read_csv('xxx.csv', names = ['a','b','c','d','message'], index_col = 'message')

有些表格可能不是用固定的分隔符去分隔字段，因此可以编写一个正则表达式来作为read_table的分隔符。

可以用skiprows跳过文件指定行。

逐块读取文本文件

有时候文件太大，可以只读取文件的一小部分或者逐块对文件进行迭代。

只读几行的话，可以通过nrows进行指定。

若需逐块读取文件，需要设置chunksize（行数）：

chunker = pd.read_csv('xxxx.csv',chunksize = 1000)
tot = Series([])
for piece in chunker:

tot = tot.add(piece['key'].value_counts(),fill_value=0)

tot = tot.order(ascending = False)

此处迭代处理csv，将值计数聚合到'key'列中。

输出

通过DataFrame的to_csv方法，我们可以将数据写到一个以逗号分隔的文件中。缺失值在输出结果中会被表示为空字符串，也可以表示为其他标记值。

猜你喜欢

转载自www.cnblogs.com/yzhnm/p/10289022.html

python--学习笔记7 文件格式、数据读取、储存

python pickle读取，储存数据

【笔记】yaml文件：yaml语法、yaml储存数据，封装类读取yaml配置文件

python读取数据科学常用文件格式

python读取图片并储存为CSV文件

python--笔记：数据的获取

python文件储存-对csv文件的读取和写入

python文件储存-对docx文件的读取和写入

Python--学习笔记2 常用库 <利用Python进行数据分析>

python--学习笔记8 数据规整化，清理、转换、合并、重塑

python--基础学习--文件及目录操作

《Tensorflow机器学习项目实战》Tensorflow 读取Iris数据集CSV格式文件读取

python tushare日期数据格式本地储存问题

Python--读取csv文件的整列

python学习笔记(xpath、csv格式储存、词云wordcloud)

Python学习笔记（7）文件和异常

python --文件读取数据

Python--学习笔记1

python学习笔记7---数据存储

学习python--第六天(文件处理)

python中的数据永久储存到文件中：pickle

Python学习笔记_从CSV读取数据写入Excel文件中

Python学习笔记之从文件中读取数据

python+selenium+new——xlrd库——读取excel文件——xls结尾为示例 ——数据格式

使用python依次读取文件中的所有csv格式的数据

python--学习数据伪造模块faker

Python读取jsonlines格式文件

在python里面读取json格式文件

python读取word文件【docx格式】

Python 读取wav格式文件

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)