使用python-docx合并多个纯文本docx文档

python-docx插件可以方便的操作docx文档,注意不是doc格式,这两种格式本质上是完全不一样的东西,doc需要使用win32com来操作,速度比较慢,python-docx的速度相比之下就太快了。

下面代码是合并纯文本(不含图片)的docx文档,暂只列出了合并两个文档的代码,可稍加修改做成合并无数个的功能。

from docx import Document
import re

files = "企业计划书范文(创办你的企业).docx"

#合并多个docx文件
def combine_word_documents(files):
    # 新建一空文件,用来保存合并后的内容
    merged_document = Document("template/通用.docx")
    #读入一个文件
    sub_doc = Document(files)
    #循环写入element,适合纯文本
    for body in sub_doc._element.body:
        merged_document._element.body.append(body)
    #保存新文件
    merged_document.save("test/test.docx")

combine_word_documents(files)

如果哪位朋友有docx文的需求可以留消息给我,试着研究一下。

猜你喜欢

转载自blog.csdn.net/wudechun/article/details/101796772