python提取pdf - 代码天地

python提取pdf

其他 2020-01-13 10:20:05 阅读次数: 0

import os
import sys
import time

pdfs = (pdfs for pdfs in os.listdir('.') if pdfs.endswith('.pdf'))

for pdf1 in pdfs:
pdf = pdf1.replace(' ', '_').replace('-', '_').replace('&', '_')
os.rename(pdf1, pdf)
print('='*30)
print(pdf)

txt = pdf[:-4] + '.txt'
exe = '"' + sys.executable + '" "'
pdf2txt = os.path.dirname(sys.executable)
pdf2txt = pdf2txt + '\\scripts\\pdf2txt.py" -o '
try:
#调用命令行工具pdf2txt.py进行转换
#如果pdf加密过可以改写下面的代码
#在-o前面使用-P来指定密码
cmd = exe + pdf2txt + txt + ' ' + pdf
os.popen(cmd)
#转换需要时间
time.sleep(2)
#输出转换后的文本，前200个字符
with open(txt, encoding='utf8') as fp:
print(fp.read(200))
except:
pass

码农的世界，你不懂

发布了458 篇原创文章 · 获赞 2 · 访问量 10万+

私信关注

猜你喜欢

转载自blog.csdn.net/u010395024/article/details/103869086

Python-PDF转为Word

PythonPyPDF

电子书流畅的python.pdf

python-pdf添加水印

Deep Learning with Python.pdf 免费下载

Python-pdf工具自制（合并、拆分、删除）

python.pdf 利用python PyPDF2 实现pdf操作全集

Python创始人深度讲解书籍《Python Cookbook》赠pythonPDF电子书

年薪50万的Python程序员都在看的一本书，珍藏！送你pythonPDF!

一份可以带你飞的python书单推荐+pythonPDF书籍资料免费送给你！

python提取pdf

pythonpdf转word的创新点,pythonpdf转word多少钱

python提取pdf文本内容

Python提取PDF中的图片

python提取pdf中的表格

python pdfplumber用于pdf表格提取

使用python提取英语pdf内容并翻译

提取Pdf图片（Python_2）

Python提取PDF中表格数据

python读取pdf提取文字和图片

Python提取PDF表格及文本！（附源码）

Python提取PDF中的文字和图片

Python提取PDF中的信息，写入Excel

【PDF】使用python提取PDF里面的图片

如何用Python批量提取PDF文本内容？

python从pdf文件中提取文本，并自动翻译

提取PDF内容保存到Excel--Python3实现

Python提取PDF电子发票内容保存到Excel

用python提取PDF表格内容保存到excel

[Python工具]pdf表格提取camelot安装教程

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)