Utilisez python pour convertir des fichiers doc Word en fichiers docx

1. Objectifs d'apprentissage:

Utilisez principalement python pour mentionner les données du fichier docx de word. Mais aujourd'hui, j'ai trouvé que s'il s'agit d'un fichier Word avec un suffixe doc, une erreur sera signalée, de sorte que les données ne peuvent pas être extraites, puis j'ai commencé à rechercher si j'utilise python pour récupérer le document et le remplacer par un fichier docx. J'ai constaté que de nombreux articles sont traités à l'aide du module win32com.

2. Code de conversion directe:

Pas grand chose à dire, allez directement au code que j'ai compilé et testé avec succès:

from win32com import client as wc #导入模块


def doc_to_docx(file):
    word = wc.Dispatch("Word.Application") # 打开word应用程序
    doc = word.Documents.Open(file) #打开word文件
    doc.SaveAs("{}x".format(file), 12)#另存为后缀为".docx"的文件,其中参数12指docx文件
    doc.Close() #关闭原来word文件
    word.Quit()
    print("完成!")
    return "{}x".format(file)


if __name__ == '__main__':
    file = r"D\sub_demand_id_653__data.doc"
    doc_to_docx(file)

rappelles toi. Le fichier doc est une adresse de chemin absolu, sinon une erreur peut être signalée.
Si vous souhaitez extraire des données de mots, vous pouvez rechercher mon autre blog.

référence:

https://zhuanlan.zhihu.com/p/133787171
https://zhuanlan.zhihu.com/p/64189783
Recherche d'articles supplémentaires

Je suppose que tu aimes

Origine blog.csdn.net/weixin_42081389/article/details/108513828
conseillé
Classement