python识别pdf中的表格并保存execl - 代码天地

python识别pdf中的表格并保存execl

其他 2023-07-22 17:51:13 阅读次数: 0

识别pdf中的表格并保存execl
pdf每个页码保存一个Execl Sheet页

		# 识别pdf表格保存到Execl
    def Get_Table_From_PDF(self,filePath,):
        y = 0
        j = 0
        # 定义保存Excel的位置
        self.workbook = xlwt.Workbook()                 #定义workbook
        self.sheet = self.workbook.add_sheet('Sheet')   #添加sheet
        pdf = pdfplumber.open(filePath)
        for page in pdf.pages:
            #根据pdf页码生成对应的Execl sheet页数
            if j<len(pdf.pages):
                 j =j+ 1
                 self.sheet = self.workbook.add_sheet('Sheet'+str(j))   #添加sheet
            # 获取当前页面的全部文本信息，包括表格中的文字
            # print(page.extract_text())                     
            for table in page.extract_tables():
                for row in table:  
                    for j in range(len(row)):
                        self.sheet.write(y, j, row[j])
                    y =y + 1
        pdf.close()
        # 保存Excel表
        self.workbook.save('D:/Python/宜10-8-42井完井卡片.xls')

猜你喜欢

转载自blog.csdn.net/tone1128/article/details/105531465

python识别pdf中的表格并保存execl

python提取pdf表格数据并保存到excel中

把Execl表格中的数据获取出来保存到数据库中

python提取pdf中的表格

PDF表格识别

如何轻松的把图片导入execl表格中

把EXECL表格导入到WORD中

用python提取PDF表格内容保存到excel

python京东爬虫保存到表格中

Python爬取PDF中的表格

python中读取execl、xlrd

python xlrd xlwt获取数据到execl表格样例

python3将爬取的数据写入execl表格

EXECL常用表格

[Tips] execl 旋转表格

execl、word转pdf

用python解析pdf中的文本与表格【pdfplumber的安装与使用】

读取pdf中的表格转换为excel格式 (python)

python调用百度ai将图片/pdf识别为表格excel

Java 在PDF中添加表格

从pdf中读取表格数据

python 保存图片至pdf

xlrd、xlwt操作execl表格

java 技术导出EXECL表格

关于vue导出execl表格

HTML页面导出execl表格

操作execl表格---xlrd，xlutils

python-opencv表格识别

利用VBA将表格保存为PDF文件

【script】python识别pdf文档

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)