使用Python将PDF批量转为word或者html，亲测好用 - 代码天地

使用Python将PDF批量转为word或者html，亲测好用

物联网 2023-12-16 17:42:34 阅读次数: 0

主要利用了Adobe Acrobat DC软件的能力，python环境的配置略过…
第一步：
安装win32com

pip install win32com

第二步：
下载Adobe Acrobat DC，软件本身是收费的，但是有万能的度娘，附个链接吧
提取码：8888

第三步：
执行下列代码

from win32com.client.dynamic import Dispatch, ERRORS_BAD_CONTEXT

import os
import winerror
from time import sleep

ERRORS_BAD_CONTEXT.append(winerror.E_NOTIMPL)


def pdf2word(f_path, d_path):
    try:
        AvDoc = Dispatch("AcroExch.AVDoc")
        AvDoc.Open(f_path, "")
        pdDoc = AvDoc.GetPDDoc()
        jsObject = pdDoc.GetJSObject()
        jsObject.SaveAs(d_path, "com.adobe.acrobat.html")
        print('ok')
    except Exception as e:
        print('error')
        print(e)
    finally:
        pdDoc.Close()
        AvDoc.Close(True)


paths = os.walk(r'D:\AAA_DWP\files')
for path, dir_lst, file_lst in paths:
    for file_name in file_lst:
        if file_name.startswith("~$"):
            continue
        if file_name.endswith(".pdf"):
            print('>>>>>>>>>>>>>>>>>>>> start:', file_name)
            full_name = os.path.join(path, file_name)
            out_file = full_name.replace('.pdf', '.html')
            if os.path.exists(out_file):
                continue
            else:
                f_path = full_name
                d_path = 'D:\\AAA_DWP\\files\\output\\' + file_name.replace('.pdf', '.html')
                pdf2word(f_path, d_path)
                print('>>>>>>>>>>>>>>>>>>>> finish')
                sleep(10)

猜你喜欢

转载自blog.csdn.net/qq_27574367/article/details/131435043

使用Python将PDF批量转为word或者html，亲测好用

使用python批量将word转为pdf

使用Python批量将Word文件转为PDF文件

[转]Python代码教你批量将PDF转为Word

使用word批量将.docx（或者.doc）转成.pdf

使用aspose将word转为pdf

手把手 | 20行Python代码教你批量将PDF转为Word

将HTML转为word

mac用python将html转为pdf

使用pdfkit将HTML转为PDF

将html转为pdf（）

Python 批量将 Word 转换为 PDF

Python实现Word、Excel、PPT批量转为PDF

Java 将PDF转为Word

Java 将HTML转为Word

Java 将Html转为PDF

C# 将PDF转为Word、Html、XPS、SVG、PCL、PS——基于Spire.Cloud.PDF

Java 将PDF/XPS转为Word/html/SVG/PS/PCL/PNG、PDF和XPS互转

Python-PDF转为Word

dom4j将word转pdf详细介绍（亲测可用）

java代码将word,excel转为pdf

如何免费在线将Word转为PDF？

20230919在WIN10下使用python3将PDF文档转为DOCX格式的WORD文档

使用Python将PDF转化为word

使用Python将PDF转换为WORD

python批量实现pdf转换为图片|实现pdf转为jpg/png|实现word批量转pdf|python批量实现word转换为图片

iOS拓展---[转载]使用clang将OC代码转为C++（亲测有效）

inkscape批量将svg转为pdf

PDF转换成Word转换器完全免费破解版(亲测好用)

OpenOffice 将word文档转为pdf再转为图片

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)