HashSet如何避免存储重复元素(工作原理)

为了一探究竟我建议先上源码(以set的add方法为例)如下所示:


原理hashSet底层是基于HashMap 来实现存储的,而set的 add方法其实调用的是map的put方法:


继续探究map的put方法看其实如何实现存储不重复元素的 :


可以看到在遍历table中的元素判断键和值, 
1,如果hash码值不相同,说明是一个新元素,存储;

如果没有元素和传入对象(也就是add的元素)的hash值相等,那么就认为这个元素在table中不存在,将其添加进table;

2..1,如果hash码值相同,且equles判断相等,说明元素已经存在,不存;

2..2,如果hash码值相同,且equles判断不相等,说明元素不存在,存;

如果有元素和传入对象的hash值相等,那么,继续进行equles()判断,如果仍然相等,那么就认为传入元素已经存在,不再添加,结束,否则仍然添加;


可见hashcode()和equles()在此显得很关键了,下面就来了解一下hashcode和equles这两个方法:

首先要明确:只通过hash码值来判断两个对象时否相同合适吗?答案肯定是不合适的,因为存在两个元素的hash码值相同但是并不是同一个元素这样的情况;
那么要问什么是hash码值? 
在java中存在一种hash表结构,它通过一个算法,计算出的结果就是hash码值;这个算法叫hash算法; 
hash算法是怎么计算的呢? 
是通过对象中的成员来计算出来的结果; 
如果成员变量是基本数据类型的值, 那么用这个值 直接参与计算; 
如果成员变量是引用数据类型的值,那么获取到这个成员变量的哈希码值后,再参数计算

如:新建一个Person对象,重写hashCode方法

public int hashCode() {
        final int prime = 31;
        int result = 1;
        result = prime * result + age;
        result = prime * result + ((name == null) ? 0 : name.hashCode());
        return result;
    }

可以看出,Person对象内两个参数name,age,hash码值是这两者计算后的记过,那么完全有可能两个对象name,age都不同,hash码值相同; 
下面看下equles()方法:

public boolean equals(Object obj) {
        if (this == obj)
            return true;
        if (obj == null)
            return false;
        if (getClass() != obj.getClass())
            return false;
        Person other = (Person) obj;
        if (age != other.age)
            return false;
        if (name == null) {
            if (other.name != null)
                return false;
        } else if (!name.equals(other.name))
            return false;
        return true;
    }

equles方法内部是分别对name,age进行判断,是否相等。

因此在hashSet的add方法添加元素时,仅仅依靠hash值判断是否存在是不完全的 还要依靠equals方法。

如有疑问或不同建议欢迎入群探讨或留言谢谢!


猜你喜欢

转载自blog.csdn.net/qq_39470733/article/details/80076017
今日推荐