1 Set接口简介
Set集合最大的特点就是不允许保存重复元素,其也是Collection的子接口。
在JDK 1.9以前与Collection集合的定义并无差别,Set继续使用了Collection接口中提供的方法进行操作,但是从JDK 1.9开始,Set集合也像List集合一样扩充了一些static方法,Set集合的定义如下:
public interface Set<E> extends Collection<E>
需要注意的是Set集合并不像List集合那样扩充了许多的新方法,所以无法使用List集合中提供的get()方法,也就是说它无法实现指定索引数据的获取,Set接口的继承关系如下:
从JDK 1.9之后,Set集合也提供像List集合之中类似的of()的静态方法,下面就使用此方法进行Set集合特点的验证。
范例:验证Set集合特征
package org.lks.demo;
import java.util.Set;
public class JavaReflectDemo {
public static void main(String[] args) {
Set<String> set = Set.of("hello", "world", "hello", "world");
set.forEach(System.out::println);
}
}
/*
Exception in thread "main" java.lang.IllegalArgumentException: duplicate element: hello
*/
当使用of新方法的时候,如果发现集合之中存在有重复元素则会直接抛出异常。这与传统的Set集合不保存重复元素的特点相一致,只不过自己抛出了异常而已。
Set集合的常规使用形式一定是依靠子类进行实例化的,所以Set接口之中有两个常用子类:HashSet、TreeSet。
2 HashSet子类
HashSet是Set接口里面使用最多的一个子类,其最大的特点就是保存的数据是无序的,而HashSet子类的继承关系如下:
public class HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, Serializable
这种继承的形式和之前的ArrayList是非常相似的,那么现在来观察一下类的继承结构:
范例:观察HashSet子类
package org.lks.demo;
import java.util.HashSet;
import java.util.Set;
public class JavaReflectDemo {
public static void main(String[] args) {
Set<String> set = new HashSet<String>();
set.add("hello");
set.add("world");
set.add("hello");
set.forEach(System.out::println);
}
}
通过执行结果就可以发现HashSet子类的操作特点:不允许保存重复元素(St接口定义的),另外一点HashSet之中保存的数据是无序的。
3 TreeSet子类
Set接口的另外一个子类就是TreeSet,与HashSet最大的区别在于TreeSet集合里面保存的数据是有序的,首先来观察一下TreeSet类的定义:
public class TreeSet<E>
extends AbstractSet<E>
implements NavigableSet<E>, Cloneable, Serializable
通过观察我们看出TreeSet也继承了AbstractSet父抽象类,同时实现了一个NavigableSet父接口。
范例:使用TreeSet子类
package org.lks.demo;
import java.util.Set;
import java.util.TreeSet;
public class JavaReflectDemo {
public static void main(String[] args) {
Set<String> set = new TreeSet<String>();
set.add("hello");
set.add("world");
set.add("hello");
set.forEach(System.out::println);
}
}
当利用TreeSet保存的数据的时候所有的数据都将按照数据的升序进行自动的排序处理。
4 分析TreeSet子类排序操作
经过分析之后,发现TreeSet子类之中保存的数据是允许排序的,但是这个类必须要实现Comparable接口,因为只有实现了此接口才能够确认出对象的大小关系,那么下面就使用一个定义的类来实现排序的处理操作。
范例:实现自定义排序
package org.lks.demo;
import java.util.Set;
import java.util.TreeSet;
class PersonA implements Comparable<PersonA>{
private String name;
private int age;
public PersonA() {}
public PersonA(String name, int age) {
this.name = name;
this.age = age;
}
@Override
public String toString() {
return "PersonA [name=" + name + ", age=" + age + "]";
}
@Override
public int compareTo(PersonA per) {
if( this.age > per.age) {
return 1;
}else if(this.age < per.age){
return -1;
}else {
return this.name.compareTo(per.name);
}
}
}
public class JavaReflectDemo {
public static void main(String[] args) {
Set<PersonA> set = new TreeSet<PersonA>();
set.add(new PersonA("lks", 23));
set.add(new PersonA("hhy", 20));
set.add(new PersonA("zsl", 22));
set.add(new PersonA("sss", 22));
set.add(new PersonA("hhy", 20));
set.forEach(System.out::println);
}
}
TreeSet本质是利用TreeMap子类实现的集合数据的存储,而TreeMap(树)就需要根据Comparable来确定大小关系。
在使用自定义类对象进行比较处理的时候一定要将该类之中的所有属性都依次进行大小关系的匹配,否则如果某一个或某几个属性相同的时候它也会认为是重复数据,所以TreeSet是利用了Comparable接口来确认重复数据的。
由于TreeSet在操作过程之中需要将类中所有的属性进行比对,这样的实现难度太高了,那么在实际的开发之中应该首选HashSet子类进行存储。
5 分析重复元素消除
TreeSet子类是利用了Comparable接口来实现了重复元素的判断,但是Set集合的整体特征就是不允许保存重复元素。但是HashSet判断重复元素的方式并不是利用Comparable接口完成的,他利用的是Object类中提供的方法实现的。
(1)对象编码:public int hashCode()
;
(2)对象比较:public boolean equals(Object obj)
;
在进行重复元素判断的时候首先利用hashCode()进行编码的匹配,如果该编码不存在则表示数据不存在,证明没有重复,如果该编码存在了,则进一步进行对象比较处理,如果发现重复了,则此数据是不允许保存的。如果使用的是Eclipse开发工具,则可以帮助开发者自动创建hashCode()与equals()方法。
范例:实现重复元素的处理
package org.lks.demo;
import java.util.HashSet;
import java.util.Set;
class PersonA{
private String name;
private int age;
public PersonA() {}
public PersonA(String name, int age) {
this.name = name;
this.age = age;
}
@Override
public String toString() {
return "PersonA [name=" + name + ", age=" + age + "]";
}
@Override
public int hashCode() {
final int prime = 31;
int result = 1;
result = prime * result + age;
result = prime * result + ((name == null) ? 0 : name.hashCode());
return result;
}
@Override
public boolean equals(Object obj) {
if (this == obj)
return true;
if (obj == null)
return false;
if (getClass() != obj.getClass())
return false;
PersonA other = (PersonA) obj;
if (age != other.age)
return false;
if (name == null) {
if (other.name != null)
return false;
} else if (!name.equals(other.name))
return false;
return true;
}
}
public class JavaReflectDemo {
public static void main(String[] args) {
Set<PersonA> set = new HashSet<PersonA>();
set.add(new PersonA("lks", 23));
set.add(new PersonA("hhy", 20));
set.add(new PersonA("zsl", 22));
set.add(new PersonA("sss", 22));
set.add(new PersonA("hhy", 20));
set.forEach(System.out::println);
}
}
在Java程序之中真正的重复元素的判断处理利用的就是hashCode与equals()两个方法共同作用完成的,而只有在排序要求的情况下(TreeSet)才会利用Comparable1接口来实现。