PDF转HTML的方法。

    上个项目客户提出了一个需求,要求把PDF格式的文件转化为HTML格式。

 上网查了一下,要么使用软件处理,要么是HTML格式转化为PDF。因为涉及到图文识别问题,所以说仅仅依靠前端不能实现。在网上查了几种方法,最后拍板使用pdf2htmlEX.

 pdf2htmlEX是一款开源的软件,所以说可以镶嵌到自己的项目之中,不用再手动使用软件去转化格式。

 资源在网上可以搜索的到。

 使用方法:

      1:下载资源,解压之后在本页面打开命令窗口。

      

      2:直接在命令窗口输入命令

        

        pdf2htmlEX后面为PDF文件地址,--dest-dir后,后面为输出地址。网上有具体的命令参数就不一一列举了。

        转化生成的文件:

        

  因为是要求点击列表切换网页,最后我是把转化后的HTML网页使用iframe标签引入到一个现实网页之中,最后通过点击事件动态改变iframe的href属性值来实现网页跳转问题。

  当然,如果是自己需要PDF转化HTML还是推荐使用软件,操作起来比较快捷方便。但是如果是项目中需要转化HTML还是推荐使用pdf2htmlEX,首先要自己使用命令窗口调试出合适的参数,然后通过后端技术转换。这样遇到大批量处理PDF转化HTML的话不用手动一一去转化。

猜你喜欢

转载自www.cnblogs.com/LittleT/p/9259171.html