芯片工程师使用软实力服务生活事务(二)

在生活和工作中,经常会遇到电子发票归集的问题,通常出差或者报销,都需要给公司提供相应的电子发票,但是目前国内的电子发票开具系统非常多,各家的文件命名格式也不尽相同,通常无法通过电子发票的PDF推测出发票里边的具体内容,这个对于归集电子发票的信息,不是很方便,基于这个诉求,笔者开发了一个python脚本,用来归集电子发票的费用信息,非常方便大家对于多张电子发票的费用信息做抽取和归总。话不多说,ICer GO!
通常一个电子发票PDF分为以下的一些信息
在这里插入图片描述
这里有很多信息,通常大家关心的是发票价格信息,具体是这里

在这里插入图片描述
通过python脚本,将上述PDF进行解析,实现提取加税合计小写信息,譬如这里就是;¥847.00。
脚本演示如下
在这里插入图片描述
对应的脚本会导出一个sumary供用户查看细节
在这里插入图片描述
文件的最后一行,会标记出所有处理的电子发票的数量和累计金额
如果指定电子发票PDF文件目录,脚本会自动抽取所有的PDF进行处理和加总
在这里插入图片描述
对应的summary加总文件如下
在这里插入图片描述
github项目:[email protected]:icer2020/pdf_capture.git
脚本: pdf_capture_receipt.py
有需要的小伙伴,自行取拿。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/i_chip_backend/article/details/130026993