python-docx を使用して複数のプレーンテキスト docx ドキュメントをマージする

python-docx プラグインは、docx ドキュメントを簡単に操作できます。doc 形式ではないことに注意してください。これら 2 つの形式は本質的にまったく異なります。Doc は win32com を使用する必要があり、速度が比較的遅いです。それに比べて python-docx の速度は速すぎます。

次のコードは、プレーン テキスト (画像を除く) の docx ドキュメントを結合するものです。現時点では、2 つのドキュメントを結合するコードのみを示しています。少し変更することで、結合機能を無数に増やすことができます。

from docx import Document
import re

files = "企业计划书范文(创办你的企业).docx"

#合并多个docx文件
def combine_word_documents(files):
    # 新建一空文件,用来保存合并后的内容
    merged_document = Document("template/通用.docx")
    #读入一个文件
    sub_doc = Document(files)
    #循环写入element,适合纯文本
    for body in sub_doc._element.body:
        merged_document._element.body.append(body)
    #保存新文件
    merged_document.save("test/test.docx")

combine_word_documents(files)

友人が docx テキストを必要としている場合は、私にメッセージを残して勉強してみてください。

おすすめ

転載: blog.csdn.net/wudechun/article/details/101796772