Java计算文件的hash值

如何知道一个文件是否改变了呢？当然是用比较文件hash值的方法，文件hash又叫文件签名，文件中哪怕一个bit位被改变了，文件hash就会不同。

比较常用的文件hash算法有MD5和SHA-1。

我用的是MD5算法，java中，计算MD5可以用MessageDigest这个类。

下面提供两个工具类（任选其一即可）

第一个工具类：

代码如下：

package com.test;

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import java.io.InputStream;

import java.math.BigInteger;

import java.security.MessageDigest;

public class MD5Util {

public static void main(String[] args) {

try {

//此处我测试的是我本机jdk源码文件的MD5值

String filePath = "C:\\Program Files\\Java\\jdk1.7.0_45\\src.zip";

String md5Hashcode = md5HashCode(filePath);

String md5Hashcode32 = md5HashCode32(filePath);

System.out.println(md5Hashcode + "：文件的md5值");

System.out.println(md5Hashcode32+"：文件32位的md5值");

//System.out.println(-100 & 0xff);

} catch (FileNotFoundException e) {

e.printStackTrace();

}

/**

* 获取文件的md5值，有可能不是32位

* @param filePath 文件路径

* @return

* @throws FileNotFoundException

public static String md5HashCode(String filePath) throws FileNotFoundException{

FileInputStream fis = new FileInputStream(filePath);

return md5HashCode(fis);

}

/**

* 保证文件的MD5值为32位

* @param filePath 文件路径

* @return

* @throws FileNotFoundException

public static String md5HashCode32(String filePath) throws FileNotFoundException{

FileInputStream fis = new FileInputStream(filePath);

return md5HashCode32(fis);

}

/**

* java获取文件的md5值

* @param fis 输入流

* @return

public static String md5HashCode(InputStream fis) {

try {

//拿到一个MD5转换器,如果想使用SHA-1或SHA-256，则传入SHA-1,SHA-256

MessageDigest md = MessageDigest.getInstance("MD5");

//分多次将一个文件读入，对于大型文件而言，比较推荐这种方式，占用内存比较少。

byte[] buffer = new byte[1024];

int length = -1;

while ((length = fis.read(buffer, 0, 1024)) != -1) {

md.update(buffer, 0, length);

}

fis.close();

//转换并返回包含16个元素字节数组,返回数值范围为-128到127

byte[] md5Bytes = md.digest();

BigInteger bigInt = new BigInteger(1, md5Bytes);//1代表绝对值

return bigInt.toString(16);//转换为16进制

} catch (Exception e) {

e.printStackTrace();

return "";

}

/**

* java计算文件32位md5值

* @param fis 输入流

* @return

public static String md5HashCode32(InputStream fis) {

try {

//拿到一个MD5转换器,如果想使用SHA-1或SHA-256，则传入SHA-1,SHA-256

MessageDigest md = MessageDigest.getInstance("MD5");

//分多次将一个文件读入，对于大型文件而言，比较推荐这种方式，占用内存比较少。

byte[] buffer = new byte[1024];

int length = -1;

while ((length = fis.read(buffer, 0, 1024)) != -1) {

md.update(buffer, 0, length);

}

fis.close();

//转换并返回包含16个元素字节数组,返回数值范围为-128到127

byte[] md5Bytes = md.digest();

StringBuffer hexValue = new StringBuffer();

for (int i = 0; i < md5Bytes.length; i++) {

int val = ((int) md5Bytes[i]) & 0xff;//解释参见最下方

if (val < 16) {

/**

* 如果小于16，那么val值的16进制形式必然为一位，

* 因为十进制0,1...9,10,11,12,13,14,15 对应的 16进制为 0,1...9,a,b,c,d,e,f;

* 此处高位补0。

hexValue.append("0");

}

//这里借助了Integer类的方法实现16进制的转换

hexValue.append(Integer.toHexString(val));

}

return hexValue.toString();

} catch (Exception e) {

e.printStackTrace();

return "";

}

/**

* 方法md5HashCode32 中 ((int) md5Bytes[i]) & 0xff 操作的解释：

* 在Java语言中涉及到字节byte数组数据的一些操作时，经常看到 byte[i] & 0xff这样的操作，这里就记录总结一下这里包含的意义：

* 1、0xff是16进制（十进制是255），它默认为整形，二进制位为32位，最低八位是“1111 1111”，其余24位都是0。

* 2、&运算: 如果2个bit都是1，则得1，否则得0；

* 3、byte[i] & 0xff：首先，这个操作一般都是在将byte数据转成int或者其他整形数据的过程中；使用了这个操作，最终的整形数据只有低8位有数据，其他位数都为0。

* 4、这个操作得出的整形数据都是大于等于0并且小于等于255的

}

运行结果如下图：

第二个工具类：

结果一定为32位的，具体可看代码，代码如下：

package com.test;

import java.io.File;

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import java.io.IOException;

import java.nio.ByteBuffer;

import java.nio.channels.FileChannel;

import java.security.MessageDigest;

import java.security.NoSuchAlgorithmException;

import java.util.Arrays;

/**

* Md5校验工具类

public class MD5Util2 {

private static final char[] hexDigits = {'0', '1', '2', '3', '4', '5', '6', '7', '8', '9',

'a', 'b', 'c', 'd', 'e', 'f'};

public static void main(String[] args) {

//此处我测试的是我本机jdk源码文件的MD5值

String filePath = "C:\\Program Files\\Java\\jdk1.7.0_45\\src.zip";

String md5Hashcode2 = MD5Util2.getFileMD5(new File(filePath));

System.out.println("MD5Util2计算文件md5值为：" + md5Hashcode2);

System.out.println("MD5Util2计算文件md5值的长度为：" + md5Hashcode2.length());

}

/**

* Get MD5 of a file (lower case)

* @return empty string if I/O error when get MD5

public static String getFileMD5( File file) {

FileInputStream in = null;

try {

in = new FileInputStream(file);

FileChannel ch = in.getChannel();

return MD5(ch.map(FileChannel.MapMode.READ_ONLY, 0, file.length()));

} catch (FileNotFoundException e) {

return "";

} catch (IOException e) {

return "";

} finally {

if (in != null) {

try {

in.close();

} catch (IOException e) {

// 关闭流产生的错误一般都可以忽略

}

/**

* MD5校验字符串

* @param s String to be MD5

* @return 'null' if cannot get MessageDigest

private static String getStringMD5( String s) {

MessageDigest mdInst;

try {

// 获得MD5摘要算法的 MessageDigest 对象

mdInst = MessageDigest.getInstance("MD5");

} catch (NoSuchAlgorithmException e) {

e.printStackTrace();

return "";

}

byte[] btInput = s.getBytes();

// 使用指定的字节更新摘要

mdInst.update(btInput);

// 获得密文

byte[] md = mdInst.digest();

// 把密文转换成十六进制的字符串形式

int length = md.length;

char str[] = new char[length * 2];

int k = 0;

for (byte b : md) {

str[k++] = hexDigits[b >>> 4 & 0xf];

str[k++] = hexDigits[b & 0xf];

}

return new String(str);

}

@SuppressWarnings("unused")

private static String getSubStr( String str, int subNu, char replace) {

int length = str.length();

if (length > subNu) {

str = str.substring(length - subNu, length);

} else if (length < subNu) {

// NOTE: padding字符填充在字符串的右侧，和服务器的算法是一致的

str += createPaddingString(subNu - length, replace);

}

return str;

}

private static String createPaddingString(int n, char pad) {

if (n <= 0) {

return "";

}

char[] paddingArray = new char[n];

Arrays.fill(paddingArray, pad);

return new String(paddingArray);

}

/**

* 计算MD5校验

* @param buffer

* @return 空串，如果无法获得 MessageDigest实例

private static String MD5(ByteBuffer buffer) {

String s = "";

try {

MessageDigest md = MessageDigest.getInstance("MD5");

md.update(buffer);

byte tmp[] = md.digest(); // MD5 的计算结果是一个 128 位的长整数，

// 用字节表示就是 16 个字节

char str[] = new char[16 * 2]; // 每个字节用 16 进制表示的话，使用两个字符，

// 所以表示成 16 进制需要 32 个字符

int k = 0; // 表示转换结果中对应的字符位置

for (int i = 0; i < 16; i++) { // 从第一个字节开始，对 MD5 的每一个字节

// 转换成 16 进制字符的转换

byte byte0 = tmp[i]; // 取第 i 个字节

str[k++] = hexDigits[byte0 >>> 4 & 0xf]; // 取字节中高 4 位的数字转换, >>>,

// 逻辑右移，将符号位一起右移

str[k++] = hexDigits[byte0 & 0xf]; // 取字节中低 4 位的数字转换

}

s = new String(str); // 换后的结果转换为字符串

} catch (NoSuchAlgorithmException e) {

e.printStackTrace();

}

return s;

}

运行结果如下图：

两个工具类的对比：

测试代码如下：

package com.test;

import java.io.File;

import java.io.FileNotFoundException;

public class test {

public static void main(String[] args) {

try {

//此处我测试的是我本机jdk源码文件的MD5值

String filePath = "C:\\Program Files\\Java\\jdk1.7.0_45\\src.zip";

long start = System.currentTimeMillis();

String md5Hashcode = MD5Util.md5HashCode(filePath);

long end = System.currentTimeMillis();

String md5Hashcode2 = MD5Util2.getFileMD5(new File(filePath));

long end1 = System.currentTimeMillis();

System.out.println("MD5Util 计算文件md5值为：" + md5Hashcode + " --useTime:"+(end-start));

System.out.println("MD5Util2计算文件md5值为：" + md5Hashcode2 + " --useTime:"+(end1-end));

} catch (FileNotFoundException e) {

e.printStackTrace();

}

运行结果如下图：

结论：

对比用时，建议使用第二个工具类！

番外篇：

其实还有一个重点，就是如何知道自己生成的MD5值是否正确呢？

方法很多，其实有一个挺简单的方法，不需要另外安装什么软件。

使用windows自带的命令即可：certutil -hashfile [文件路径] MD5，

例子如下：

————————————————

原文链接：https://blog.csdn.net/qq_25646191/article/details/78863110

Java计算文件的hash值

猜你喜欢