python提取pdf中的表格 - 代码天地

python提取pdf中的表格

其他 2020-10-19 10:56:29 阅读次数: 0

import pdfplumber
import xlwt

# 定义保存Excel的位置
workbook = xlwt.Workbook()  #定义workbook
sheet = workbook.add_sheet('Sheet1')  #添加sheet
i = 0 # Excel起始位置

path = input("请输入PDF文件位置：")    
#path = "aaaaaa.PDF"  # 导入PDF路径
pdf = pdfplumber.open(path)
print('\n')
print('开始读取数据')
print('\n')
for page in pdf.pages:
    # 获取当前页面的全部文本信息，包括表格中的文字
    # print(page.extract_text())                     
    for table in page.extract_tables():
        # print(table)
        for row in table:            
            print(row)
            for j in range(len(row)):
                sheet.write(i, j, row[j])
            i += 1
        print('---------- 分割线 ----------')

pdf.close()

# 保存Excel表
workbook.save('PDFresult.xls')
print('\n')
print('写入excel成功')
print('保存位置：')
print('C:/Users/Administrator/Desktop/PDFresult.xls')
print('\n')
input('PDF取读完毕，按任意键退出')

猜你喜欢

转载自blog.csdn.net/Abecedarian_CLF/article/details/102299916

python提取pdf中的表格

python提取pdf表格数据并保存到excel中

python pdfplumber用于pdf表格提取

Python提取PDF中表格数据

Python提取PDF表格及文本！（附源码）

Python提取PDF中的图片

手把手教你用Python提取PDF中的表格

#代码人生# 把PDF中的表格提取到Excel中

用python提取PDF表格内容保存到excel

[Python工具]pdf表格提取camelot安装教程

通过Python的pdfplumber库提取pdf中表格数据

在Java中使用tabula提取PDF中的表格数据

python提取word表格中数据

Python提取PDF中的文字和图片

Python提取PDF中的信息，写入Excel

Python爬取PDF中的表格

python识别pdf中的表格并保存execl

python提取pdf

【PYTHON,PDF】1.利用python.pypdf2 进行文字表格提取

PDF提取表格的网页工具——Excalibur

Camelot:从pdf中提取表格数据

提取PDF里面的EXCEL表格

【python办公自动化】将Word文本和Pdf表格数据提取并整合到同一个Exeel下的多sheet中

python提取Excel中的特定列生成新的表格

【Python提取Excel表格中符合条件的数据】

利用python第三方库提取PDF文件的表格内容

又学到一招，只需三行 Python 代码轻松提取 PDF 表格数据

实用操作（一）——从PDF中批量提取图片（Python实现）

通过Python的fitz库提取pdf中的图片

通过Python的pdfplumber库提取pdf中的文字

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)