Set集合的特点以及唯一性原理（如何保证元素不可重复）

Set集合是Collection集合的子接口，它有三个常用子类：

1.HashSet：底层结构是哈希表。无序(新增顺序和获取顺序不一定一致)。

2.LinkedHashSet：哈希表+链表。有序。

3.TreeSet<E>：红黑树。可排序的

一、HashSet

底层原理是Hash表实现的，存储元素的顺序不是按照存入的顺序，而是按照哈希值来存取数据（无序），哈希值通过hashcode方法获取。判断两个元素是否相等时，首先比较两个元素的哈希值是否相等，再比较equals方法，如果返回的是true，则两个元素对象相等，视为同一个元素。所以，HashSet添加一个元素时，当哈希值相同，equals为false时，添加的元素在相同的哈希值下顺延，即存一列（放在同一个哈希桶中）；当哈希值不同，equals返回true时，也会存入到不同哈希值下并添加成功；都相同时则视为同一元素，添加失败。同时，线程是不安全的。

二、LinkedHashSet

LinkedHashSet是HashSet的子类，也是根据hashcode的值来存储数据，不允许元素重复，使用时直接调用HashSet的方法，但是由于是基于LinkedHashMap实现的，以双向链表来维护插入元素的顺序，所以看起来是按照插入的顺序来存放的。

三、TreeSet

TreeSet底层采用的是红黑树存储数据，可以确保元素有排序的状态，所以此结构是有序的，查询速度较list更快。排序方式包括自然排序和定制排序。

自然排序

TreeSet 会调用集合元素的 compareTo(Object obj) 方法来比较元素之间的大小关系，然后将集合元素按升序(默认情况)排列

如Integer和String对象都可以进行默认的排序，但如果要添加一个元素，那么该元素的的类必须实现Comparable接口和compareTo方法。

定制排序

若元素所属的类没有实现Comparable接口，或不希望按照升序、降序的方式排列元素或按照其它属性大小进行排序，则可以使用定制排序，通过Comparator接口来实现，需要重写compare(T o1,T o2)方法，即利用int compare(T o1,T o2)方法，比较o1和o2的大小：如果方法返回正整数，则表示o1大于o2；如果返回0，表示相等；返回负整数，表示o1小于o2。

Set集合是如何保证元素不可重复

Set集合的特点如下：

1，元素无序

2，元素不可重复

那么Set集合底层是如何保证元素无序的呢？

1，在往Set集合中添加对象的时候，首先会通过该对象的hashCode方法计算该对象的hash值。

2，将计算出来的hash值去hash表中查询，如果hash表中不存在该值，则对象添加成功。如果hash表中有该hash值，那么还会将要添加的对象和集合中的对象进行进一步的比较，使用对象的equals方法比较对象的field，如果field也相同，则是重复的对象，该对象添加失败。如果equals返回的是false，则说明两个对象不是同一个对象。则该对象就会添加到已有对象链表的末尾。该种情况称为hash碰撞。

总结

Set集合是通过hashCode和equals方法来保证元素不可重复的。之所以先计算hashCode，是为了提高添加的效率。所以当自定义对象需要保存到Set集合中的时候，就需要重写以上两个方法。

重点：

如果元素存储位置不为空，也就是已经有元素了，则会进行比较

如果哈希值不同，说明新元素与旧元素不同，可以将新元素加入到集合中

如果哈希值相同，则继续调用对象的equals方法进行比较

如果equals方法比较的结果为false，说明两者不同，将新元素加入到集合中

如果equals方法比较的结果为true，说明两者完全相同，不会添加新元素

重写hashCode方法时的原则：

保证同一个对象返回的hash值相同。

不同对象计算出来的hash值不同。

Set集合的特点以及唯一性原理（如何保证元素不可重复）

猜你喜欢