记录一下 Java 代码实现文件夹、文件的对比,主要包含 word、pdf、文本、图片等相关文件的对比计算,以及计算文本的相似率(重复率)、筛选出差异的文件、方便文件和文档的去重,并把所有的源码封装为jar包,简单集成,只需要一行代码即可调用。
1、准备工作
1)、下载封装好的jar包,并放入项目,具体可以参照下面的连接中的 “1.集成到项目” 这一章节:
https://blog.csdn.net/u014374009/article/details/104783988
2)、准备两个有差异的 word 文档,如下所示:
2、开始使用
1)、新建一个类,如下所示进行调用:
package com.ycj.fastframe.filetext;
/**
* @author: Frank
* @email [email protected]
* @date: 2020/3/12
* @time: 11:31
* @fuction: about the role of class.
*/
public class TestFileText {
public static void main(String[] args) {
try {
WordCompare.compareWord("D:\\ceshi\\711.docx", "D:\\ceshi\\811.docx","D:\\ceshi\\911.docx");
} catch (Exception e) {
e.printStackTrace();
}
}
}
2)、直接右击运行,或者点击运行按钮,运行结束如下图所示。
3)、源目标位置出现一个新的 911.docx 的word文件。
4、打开word文件进行查看,发现各种差异和修改都已经标识出来了,很方便用作版本差异对比。
备注:目前不是很支持那种格式特别复杂的word文档或页眉页脚的设计。
3、文档比较
1)、新建一个类,如下所示进行调用:
package com.ycj.fastframe.filetext;
/**
* @author: Frank
* @email [email protected]
* @date: 2020/3/12
* @time: 11:31
* @fuction: about the role of class.
*/
public class TestFileText {
public static void main(String[] args) {
DocumentCompare.compare("D:\\ceshi\\711.docx", "D:\\ceshi\\811.docx");
}
}
2)、直接右击运行,或者点击运行按钮,运行结束如下图所示。
3)、点击生成的连接,即可查看文档对比的差异。
4、更多方法
1)、获取文件的信息
2)、读取文件内容
3)文件夹比较
4)、图片比较
5)PDF文件比较
6)文本比较(可以返回list结果,也可以返回 html)
7)Word文档相关
扫描二维码关注公众号,回复:
9789486 查看本文章