有时候我们需要将doc的文件转成docx的格式,但是如果直接修改文件名后缀的话有时候会没有效果,今天我们利用python批量将doc后缀的word文档转成docx的格式。
也找了很多方法,最终还是找到了就是利用win32com去解决这个问题
很多人在执行这一行代码的时候:word = wc.Dispatch("wps.Application")
,遇到到这个错误:pywintypes.com_error: -2147221005
,是因为金山WPS调用的版本不一致,是因为金山WPS调用:
抢先版、专业版的用,word = wc.Dispatch(“kwps.Application”)
正式版的用, word = wc.Dispatch(“wps.Application”)
那么接下来我们测试一下,我准备了一下doc文件
视频演示(我删了等待的帧率)
代码
注意事项:
1、doc = wd.Documents.Open(r"这里最好用绝对路径!!
")
2、doc.SaveAs(r"这里的保存路径也用绝对路径
", 12)
from win32com.client import Dispatch
def doc_to_docx():
for f in os.listdir('./doc文件/'):
wd = Dispatch("kwps.Application")
wd.Visible = 0
wd.DisplayAlerts = 0
doc = wd.Documents.Open(rf"F:\随笔\测试\doc文件\{
f}")
doc.SaveAs(rf"F:\随笔\测试\转换结果\{
f.split('.')[0]}.docx", 12)
doc.Close()
wd.Quit()
doc_to_docx()
读取docx文件内容
用到的库是:python-docx
安装:pip install python-docx
视频展示
代码
from docx import Document
def read_docx():
docStr = Document("./转换结果/" + os.listdir("./转换结果/")[0])
for paragraph in docStr.paragraphs:
parStr = paragraph.text
print(parStr)
read_docx()
希望对大家有帮助
致力于办公自动化的小小程序员一枚
都看到这了,关注+点赞+收藏=不迷路!!