HashSet如何避免存储重复元素（工作原理）

为了一探究竟我建议先上源码（以set的add方法为例）如下所示：

原理hashSet底层是基于HashMap 来实现存储的，而set的 add方法其实调用的是map的put方法：

继续探究map的put方法看其实如何实现存储不重复元素的：

可以看到在遍历table中的元素判断键和值，
1，如果hash码值不相同，说明是一个新元素，存储；

如果没有元素和传入对象（也就是add的元素）的hash值相等，那么就认为这个元素在table中不存在，将其添加进table；

2..1，如果hash码值相同，且equles判断相等，说明元素已经存在，不存；

2..2，如果hash码值相同，且equles判断不相等，说明元素不存在，存；

如果有元素和传入对象的hash值相等，那么，继续进行equles()判断，如果仍然相等，那么就认为传入元素已经存在，不再添加，结束，否则仍然添加；

可见hashcode()和equles()在此显得很关键了，下面就来了解一下hashcode和equles这两个方法：

首先要明确：只通过hash码值来判断两个对象时否相同合适吗？答案肯定是不合适的，因为存在两个元素的hash码值相同但是并不是同一个元素这样的情况；
那么要问什么是hash码值？
在java中存在一种hash表结构，它通过一个算法，计算出的结果就是hash码值；这个算法叫hash算法；
hash算法是怎么计算的呢？
是通过对象中的成员来计算出来的结果；
如果成员变量是基本数据类型的值，那么用这个值直接参与计算；
如果成员变量是引用数据类型的值，那么获取到这个成员变量的哈希码值后，再参数计算

如:新建一个Person对象，重写hashCode方法

public int hashCode() {
        final int prime = 31;
        int result = 1;
        result = prime * result + age;
        result = prime * result + ((name == null) ? 0 : name.hashCode());
        return result;
    }

可以看出，Person对象内两个参数name，age，hash码值是这两者计算后的记过，那么完全有可能两个对象name，age都不同，hash码值相同；
下面看下equles()方法：

public boolean equals(Object obj) {
        if (this == obj)
            return true;
        if (obj == null)
            return false;
        if (getClass() != obj.getClass())
            return false;
        Person other = (Person) obj;
        if (age != other.age)
            return false;
        if (name == null) {
            if (other.name != null)
                return false;
        } else if (!name.equals(other.name))
            return false;
        return true;
    }

equles方法内部是分别对name，age进行判断，是否相等。

因此在hashSet的add方法添加元素时，仅仅依靠hash值判断是否存在是不完全的还要依靠equals方法。

如有疑问或不同建议欢迎入群探讨或留言谢谢！

HashSet如何避免存储重复元素（工作原理）

猜你喜欢