码力十足学量化|用Python将pdf文件转换为txt文件 - 代码天地

码力十足学量化|用Python将pdf文件转换为txt文件

企业开发 2023-04-08 14:11:41 阅读次数: 0

pdf格式的文件必须用相应的pdf阅读器才能打开，而且一般的pdf阅读器打开pdf文件后并不支持编辑修改PDF文档的文字。如果可以把把pdf转化为txt文本文件，那么我们阅读编辑起来就容易的多。现在市场上已经有很多PDF转换程序，但是基本上需要付费。但是你只要学会了用Python来进行pdf文件转换为txt文件操作，仅仅只需要短短几行代码就可以搞定。废话不多说，直接上代码。
1）代码

import pdfplumber

path=r"..\requests\财务报表\\贵州茅台2021年半年度报告.pdf"
pdf=pdfplumber.open(path) # 打开PDF文件
pages=pdf.pages # 通过pages属性获取所有页的信息，此时pages是一个列表

text_all=[]
for page in pages:
    # 用extract_text()函数获取每页文本内容
    text=page.extract_text()
    text_all.append(text)

text_all="".join(text_all)
print(text_all)

# 将文件保存为txt文本格式
txt_file=open("贵州茅台2021年半年报报告.txt",mode='a',encoding='utf-8')
txt_file.write(text_all)
pdf.close()

输出效果

猜你喜欢

转载自blog.csdn.net/malishizu222/article/details/125106418

码力十足学量化|用Python将pdf文件转换为txt文件

码力十足学量化|多因子概述

码力十足学量化|macd 指标详解

码力十足学量化|Python安装及环境配置Mac版

码力十足学量化|用Python进行MySQL数据库存入、读取和删除股票数据操作

码力十足学量化|Python用requests+xpath爬取贵州茅台财务报告并保存在本地

码力十足学量化|如何在财务报告寻找合适的财务公告

码力十足学量化|MySQL数据库简介及安装

码力十足学量化|ccxt安装及获取实时K线数据

码力十足学量化|如何获取指数成分股及权重数据

码力十足学量化|基于MySQL数据库管理平台phpMyAdmin新建股票数据表

python利用pandas将excel文件转换为txt文件

将CSV文件转换为TXT文件

利用python将txt文件转换为csv

python对PDF文件做OCR识别，完成PDF转换为TXT文本！

C#实现将TXT文件转换为PDF文件

将txt文件批处理转换为csv文件

20230809在WIN10下使用python3将DOCX文件转换为TXT文件

学习资料pdf自动转换为tmp/txt文件

如何将Markdown文件转换为pdf文件

如何将PDF文件转换为PPT文件？

将txt数据文档转换为Excel文件

20230808在WIN10下使用python3将TXT文件转换为DOCX

python将py文件转换为pyc

如何将PDF文件转换成TXT文档

PDF可以转换为CAD格式吗？怎么将PDF文件转换为CAD格式？

Apache FOP 将Java对象转换为pdf文件

libreoffice将ppt、xls、doc等office文件转换为pdf

将多页PDF文件转换为多张JPG图片

如何将caj文件转换为pdf？

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)