题目链接
字符串哈希 越散列越好
哈希算法要求
将abc和bac我们认为他们是一类的字符串,计算得到的哈希值(特征值)应该一样,abc和bcd不是同一类,计算得到的哈希值应该不一样,这就是我们手写哈希算法的要求。
简单例子
将abc和bac映射成一个哈希值,简单映射 我们可以 把 a + b + c = 97 + 98 + 99 = 294作为哈希值, 和 b + a + c = 98 + 97 + 99 = 294. 显然两个哈希值一样,这也是我们想要的结果,将这两个字符串映射成哈希值相同的结果,是我们需要的。
可是 如果只进行简单相加会有一些错误的碰撞。例如:
acd和abe计算的结果是一样的。这不是我们想要的结果,所以我们要想出一个尽可能避免碰撞的哈希算法就行了。 自己想些什么就写什么,尽量让哈希散列的范围较大就行。避免不必要的错误碰撞。
public List<List<String>> groupAnagrams(String[] strs) {
Map<Integer ,List<String>> map = new HashMap<>();
for (int i = 0; i < strs.length; i++) {
int hash = gethash(strs[i]);
System.out.println(hash);
List<String> list = map.getOrDefault(hash,new ArrayList<String>());
list.add(strs[i]);
map.put(hash,list);
}
return new ArrayList<List<String>>(map.values());
}
private int gethash(String str){
int hash = 0;
for (int i = 0; i < str.length(); i++) {
char c = str.charAt(i);
hash += 5*c*c*c/26 + c*1009 - c*c*997;
}
return hash;
}
}