记录一下 Java 代码实现文件夹、文件的对比,主要包含 word、pdf、文本、图片等相关文件的对比计算,以及计算文本的相似率(重复率)、筛选出差异的文件、方便文件和文档的去重,并封装为jar包

记录一下 Java 代码实现文件夹、文件的对比,主要包含 word、pdf、文本、图片等相关文件的对比计算,以及计算文本的相似率(重复率)、筛选出差异的文件、方便文件和文档的去重,并把所有的源码封装为jar包,简单集成,只需要一行代码即可调用。

1、准备工作

1)、下载封装好的jar包,并放入项目,具体可以参照下面的连接中的 “1.集成到项目” 这一章节:
https://blog.csdn.net/u014374009/article/details/104783988

2)、准备两个有差异的 word 文档,如下所示:

测试素材下载
在这里插入图片描述

2、开始使用

1)、新建一个类,如下所示进行调用:

package com.ycj.fastframe.filetext;

/**
 * @author: Frank
 * @email [email protected]
 * @date: 2020/3/12
 * @time: 11:31
 * @fuction: about the role of class.
 */
public class TestFileText {
    public static void main(String[] args) {
        try {
            WordCompare.compareWord("D:\\ceshi\\711.docx", "D:\\ceshi\\811.docx","D:\\ceshi\\911.docx");
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

2)、直接右击运行,或者点击运行按钮,运行结束如下图所示。
在这里插入图片描述
3)、源目标位置出现一个新的 911.docx 的word文件。
在这里插入图片描述
4、打开word文件进行查看,发现各种差异和修改都已经标识出来了,很方便用作版本差异对比。
在这里插入图片描述
备注:目前不是很支持那种格式特别复杂的word文档或页眉页脚的设计。

3、文档比较

1)、新建一个类,如下所示进行调用:

package com.ycj.fastframe.filetext;

/**
 * @author: Frank
 * @email [email protected]
 * @date: 2020/3/12
 * @time: 11:31
 * @fuction: about the role of class.
 */
public class TestFileText {
    public static void main(String[] args) {
        DocumentCompare.compare("D:\\ceshi\\711.docx", "D:\\ceshi\\811.docx");
    }
}

2)、直接右击运行,或者点击运行按钮,运行结束如下图所示。
在这里插入图片描述
3)、点击生成的连接,即可查看文档对比的差异。
在这里插入图片描述

4、更多方法

1)、获取文件的信息
在这里插入图片描述
2)、读取文件内容
在这里插入图片描述
3)文件夹比较
在这里插入图片描述
4)、图片比较
在这里插入图片描述
5)PDF文件比较
在这里插入图片描述
6)文本比较(可以返回list结果,也可以返回 html)
在这里插入图片描述
7)Word文档相关
在这里插入图片描述

jar包下载地址

相关jar包集成

扫描二维码关注公众号,回复: 9789486 查看本文章
发布了67 篇原创文章 · 获赞 109 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/u014374009/article/details/104816806
今日推荐