Set集合的特点以及唯一性原理(如何保证元素不可重复)

Set集合是Collection集合的子接口,它有三个常用子类:

1.HashSet:底层结构是哈希表。无序(新增顺序和获取顺序不一定一致)。

2.LinkedHashSet:哈希表+链表。有序。

3.TreeSet<E>:红黑树。可排序的

一、HashSet

底层原理是Hash表实现的,存储元素的顺序不是按照存入的顺序,而是按照哈希值来存取数据(无序),哈希值通过hashcode方法获取。判断两个元素是否相等时,首先比较两个元素的哈希值是否相等,再比较equals方法,如果返回的是true,则两个元素对象相等,视为同一个元素。所以,HashSet添加一个元素时,当哈希值相同,equals为false时,添加的元素在相同的哈希值下顺延,即存一列(放在同一个哈希桶中);当哈希值不同,equals返回true时,也会存入到不同哈希值下并添加成功;都相同时则视为同一元素,添加失败。同时,线程是不安全的。

二、LinkedHashSet

LinkedHashSet是HashSet的子类,也是根据hashcode的值来存储数据,不允许元素重复,使用时直接调用HashSet的方法,但是由于是基于LinkedHashMap实现的,以双向链表来维护插入元素的顺序,所以看起来是按照插入的顺序来存放的。

三、TreeSet

TreeSet底层采用的是红黑树存储数据,可以确保元素有排序的状态,所以此结构是有序的,查询速度较list更快。排序方式包括自然排序和定制排序。

自然排序

TreeSet 会调用集合元素的 compareTo(Object obj) 方法来比较元素之间的大小关系,然后将集合元素按升序(默认情况)排列

如Integer和String对象都可以进行默认的排序,但如果要添加一个元素,那么该元素的的类必须实现Comparable接口和compareTo方法。

定制排序

若元素所属的类没有实现Comparable接口,或不希望按照升序、降序的方式排列元素或按照其它属性大小进行排序,则可以使用定制排序,通过Comparator接口来实现,需要重写compare(T o1,T o2)方法,即利用int compare(T o1,T o2)方法,比较o1和o2的大小:如果方法返回正整数,则表示o1大于o2;如果返回0,表示相等;返回负整数,表示o1小于o2。

Set集合是如何保证元素不可重复

Set集合的特点如下:

1,元素无序

2,元素不可重复

那么Set集合底层是如何保证元素无序的呢?

1,在往Set集合中添加对象的时候,首先会通过该对象的hashCode方法计算该对象的hash值。

2,将计算出来的hash值去hash表中查询,如果hash表中不存在该值,则对象添加成功。如果hash表中有该hash值,那么还会将要添加的对象和集合中的对象进行进一步的比较,使用对象的equals方法比较对象的field,如果field也相同,则是重复的对象,该对象添加失败。如果equals返回的是false,则说明两个对象不是同一个对象。则该对象就会添加到已有对象链表的末尾。该种情况称为hash碰撞。

总结

Set集合是通过hashCode和equals方法来保证元素不可重复的。之所以先计算hashCode,是为了提高添加的效率。所以当自定义对象需要保存到Set集合中的时候,就需要重写以上两个方法。

重点:

 如果元素存储位置不为空,也就是已经有元素了,则会进行比较

 如果哈希值不同,说明新元素与旧元素不同,可以将新元素加入到集合中

 如果哈希值相同,则继续调用对象的equals方法进行比较

 如果equals方法比较的结果为false,说明两者不同,将新元素加入到集合中

 如果equals方法比较的结果为true,说明两者完全相同,不会添加新元素

重写hashCode方法时的原则:

保证同一个对象返回的hash值相同。

不同对象计算出来的hash值不同。

猜你喜欢

转载自blog.csdn.net/miachen520/article/details/130351885