知网下载的caj转pdf得一个个手动转,而且转完了是图片格式的pdf,很不方便,所以找了个python的脚本把caj转pdf。
但是发现九成以上的都会转失败,except报错windows找不到文件。
其实找不到的是
心路历程如下:
逐步调试发现错误
报错的是kdh和caj格式的文件
def convert(self, dest):
dest = str(dest)
print('format:',self.format,end=' ')
if self.format == "CAJ":
self._convert_caj(dest)
elif self.format == "HN":
self._convert_hn(dest)
elif self.format == "C8":
self._convert_hn(dest)
elif self.format == "PDF":
self._convert_pdf(dest)
elif self.format == "KDH":
self._convert_kdh(dest)
这一步的作用是解析tmp,然后说pdf_toc找不到,那是因为没有解析出来。
check_output(["mutool", "clean", "pdf.tmp", "pdf_toc.pdf"], stderr=STDOUT)
首先要修改为:
check_output(["mutool", "clean", "pdf.tmp", "pdf_toc.pdf"], stderr=STDOUT, shell=True,check=False)
因为check参数里面默认了,所以也要修改check_output里面的参数check
run(*popenargs, stdout=PIPE, timeout=timeout, **kwargs).stdout
里面用的是subprocess.py
的Popen
里面的_execute_child
里面的_winapi.CreateProcess
总算找到了报错的地方,但是为什么是找不到文件就很奇怪。
回到_convert_caj
这里:
try:
# check_output(["mutool", "clean", "pdf.tmp", "pdf_toc.pdf"], stderr=STDOUT)
check_output(["mutool", "clean", "pdf.tmp", "pdf_toc.pdf"], stderr=STDOUT, shell=True,check=False)
except CalledProcessError as e:
print(e.output.decode("utf-8"))
raise SystemExit("Command mutool returned non-zero exit status " + str(e.returncode))
其实这个e
就看不对,最后发现是编码问题,改成e.output.decode("gb2312")
后发现,报的错误其实是找不到mutool
因为
check_output(["mutool", "clean", "pdf.tmp", "pdf_toc.pdf"], stderr=STDOUT, shell=True, check=True)
第一个参数(list)其实是指令,里面会变成"mutool clean pdf.tmp pdf_toc.pdf"
到这里会发现上面subprocess.py
用的其实是win给执行cmd命令的接口,没有mutool这个工具的话,当然会报错啦!
所以到这里总算知道了,问题出在mutool
这个工具,代码本身其实并没有问题!!
安装mutool请看:安装mutool方法
最好重启一下pycharm或者cmd窗口刷新一下环境变量。
愉快地转换了!
现在比较忙,如果有不明白的可以留言,有空的时候会补全详细步骤
要caj转pdf脚本的回头我也传上来