面试中的Collection集合————源码分析

Collection接口:单列集合,用来存储一个一个的对象

1,List接口:存储有序的,可重复的数据。 -->“动态”数组,替换原有的数组

2,ArrayList:作为List接口的主要实现类,线程不安全,效率高,底层使用Object[] elementData存储

2.1,ArrayList的源码分析:jdk7

ArrayList list = new ArrayList();//底层创建了长度是10的Object[]数组elementData
list.add(123); //elementData[0] = new Integer(123);
...
list.add(11);//如果此次的添加导致底层elementData数组数组容量不够,则扩容。默认情况下,扩容为原来的容量的1.5倍,同时需要将原有的数据复制到新的数组中。

结论:建议开发中使用带参的构造器:ArrayList list = new ArrayList(int capacity)

2.2,jdk8 中ArrayList的变化:

ArrayList list = new ArrayList();//底层Object[] elementData初始化为{},并没有创建长度为10的数组
list.add(123);//第一次调用add()时,底层才创建了长度10的数组,并将123添加到elementData中去
//后续的添加和扩容操作与jdk 7无异

结论:jdk7中的ArrayList的对象的创建类似于单例的饿汉式,而jdk8中的ArrayList的对象的创建类似于单例的懒汉式,延迟了数组的创建,节省内存。

3,LinkedList:对于频繁的插入,删除操作,使用此类效率比ArrayList高;底层使用双向链表存储

3.1, LinkedList的源码分析:

LinkedList list = new LinkedList();内部声明了Node类型的first和last属性,默认值为null
list.add(123);//将123封装到Node中,创建了Node对象。
其中,Node定义为:体现了LinkedList的双向链表的说法
    E item;
    Node<E> next;
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }

4,Vector:作为List接口的古老实现类,线程安全的,效率低,底层使用Object[] elementData存储

4.1,Vector的源码分析

         jdk7和jdk8中通过Vector()构造器创建对象时,底层都创建了长度为10的数组,在扩容方面,默认扩容为原来的数组长度的2倍


Set接口:存储无序的,不可重复的数据

1,HashSet: 作为Set接口的主要实现类,线程不安全的,可以存储null值

2,LinkedHashSet:作为HashSet的子类:遍历其内部数据时,可以按照添加的顺序遍历。对于频繁的遍历操作,LinkedHashSet效率高于HashSet.

3,TreeSet: 可以按照添加对象的指定属性

3.1 TreeSet:

1,向TreeSet中添加的数据,要求是相同类的对象

2,两种排序方式:自然排序(实现Comparable接口)和定制排序(Comparator)

3,自然排序中,比较两个对象是否相同的标准为:compareTo()返回0,不再是equals()。

4,定制排序中,比较两个对象是否相同的标准为:compare()返回0,不再是equals()。

Set源码分析

Set中无序性: 不等于随机性。存储的数据在底层数据中并非按照数组所以的顺序添加,而是根据数据的哈希值决定的

不可重复性: 保证添加元素按照equals()判断时,不能返回true。即:相同的元素只能添加一个

添加元素的过程: 以HashSet(数组+链表)为例:

我们向HashSet中添加元素a,首先调用元素a所在的hashCode()方法,计算元素a的哈希值,此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即为索引位置),判断数组此位置上是否已经有元素:

    情况1 --> 如果此位置上没有其他元素,则元素a添加成功。
                    如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
    情况2 -->         如果hash值不相同,则元素a添加成功。
                            如果hash值相同,进而需要调用元素a所在类的equals()方法:
                                equals()方法返回true,元素a添加失败。
    情况3 -->             equals()方法返回false,则元素a添加成功。

对于添加成功的情况2和情况3而言:元素a与已经存在指定索引位置上数据以链表的方式存储。
jdk7:元素a放到数组中,指向原来的元素。
jdk8:原来的元素在数组中,指向元素a
总结:七上八下

4.1 Set接口中没有额外定义新的方法,使用的都是Collection中声明过的方法。

4.2 要求:

    重写的hashCode()和equals()尽可能保持一致性:相等的对象必须具有相等的散列码
    重写两个方法的小技巧:对象中用作equals()方法比较的Field,都应该用来计算hashCode值

为什么重写hashCode方法,有31这个数字?

1,选择系数的时候要选择尽量大的系数,因为如果计算出来的hash地址越大,所谓的"冲突"就越少,查找起来效率也会提高。(减少冲突)

2,并且31只占用5bits,相乘造成数据溢出的概率较小。

3,31可以由i*31 == (i << 5)-1来表示,现在很多虚拟机里面都有做相关优化。(提高算法效率)

4,31是一个素数,素数作用就是如果我用一个数字来乘以这个素数,那么最终出来的结果只能被素数本身和被乘数还有1来整除!(减少冲突)

发布了67 篇原创文章 · 获赞 19 · 访问量 9874

猜你喜欢

转载自blog.csdn.net/qq_41530004/article/details/103890766