面试中的Collection集合————源码分析

Collection接口：单列集合，用来存储一个一个的对象

1，List接口：存储有序的，可重复的数据。 -->“动态”数组，替换原有的数组

2，ArrayList：作为List接口的主要实现类，线程不安全，效率高，底层使用Object[] elementData存储

2.1，ArrayList的源码分析：jdk7

ArrayList list = new ArrayList();//底层创建了长度是10的Object[]数组elementData
list.add(123); //elementData[0] = new Integer(123);
...
list.add(11);//如果此次的添加导致底层elementData数组数组容量不够，则扩容。默认情况下，扩容为原来的容量的1.5倍，同时需要将原有的数据复制到新的数组中。

结论：建议开发中使用带参的构造器：ArrayList list = new ArrayList(int capacity)

2.2，jdk8 中ArrayList的变化：

ArrayList list = new ArrayList();//底层Object[] elementData初始化为{}，并没有创建长度为10的数组
list.add(123);//第一次调用add()时，底层才创建了长度10的数组，并将123添加到elementData中去
//后续的添加和扩容操作与jdk 7无异

结论：jdk7中的ArrayList的对象的创建类似于单例的饿汉式，而jdk8中的ArrayList的对象的创建类似于单例的懒汉式，延迟了数组的创建，节省内存。

3，LinkedList：对于频繁的插入，删除操作，使用此类效率比ArrayList高；底层使用双向链表存储

3.1， LinkedList的源码分析：

LinkedList list = new LinkedList();内部声明了Node类型的first和last属性，默认值为null
list.add(123);//将123封装到Node中，创建了Node对象。
其中，Node定义为：体现了LinkedList的双向链表的说法
    E item;
    Node<E> next;
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }

4，Vector：作为List接口的古老实现类，线程安全的，效率低，底层使用Object[] elementData存储

4.1，Vector的源码分析：

jdk7和jdk8中通过Vector()构造器创建对象时，底层都创建了长度为10的数组，在扩容方面，默认扩容为原来的数组长度的2倍

Set接口：存储无序的，不可重复的数据

1，HashSet：作为Set接口的主要实现类，线程不安全的，可以存储null值

2，LinkedHashSet：作为HashSet的子类：遍历其内部数据时，可以按照添加的顺序遍历。对于频繁的遍历操作，LinkedHashSet效率高于HashSet.

3，TreeSet: 可以按照添加对象的指定属性

3.1 TreeSet:

1，向TreeSet中添加的数据，要求是相同类的对象

2，两种排序方式：自然排序（实现Comparable接口）和定制排序（Comparator）

3，自然排序中，比较两个对象是否相同的标准为：compareTo()返回0，不再是equals()。

4，定制排序中，比较两个对象是否相同的标准为：compare()返回0，不再是equals()。

Set源码分析

Set中无序性：不等于随机性。存储的数据在底层数据中并非按照数组所以的顺序添加，而是根据数据的哈希值决定的

不可重复性：保证添加元素按照equals()判断时，不能返回true。即：相同的元素只能添加一个

添加元素的过程：以HashSet（数组+链表）为例：

我们向HashSet中添加元素a，首先调用元素a所在的hashCode()方法，计算元素a的哈希值，此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置（即为索引位置），判断数组此位置上是否已经有元素：

    情况1 --> 如果此位置上没有其他元素，则元素a添加成功。
                    如果此位置上有其他元素b（或以链表形式存在的多个元素），则比较元素a与元素b的hash值：
    情况2 -->         如果hash值不相同，则元素a添加成功。
                            如果hash值相同，进而需要调用元素a所在类的equals()方法：
                                equals()方法返回true，元素a添加失败。
    情况3 -->             equals()方法返回false，则元素a添加成功。

对于添加成功的情况2和情况3而言：元素a与已经存在指定索引位置上数据以链表的方式存储。
jdk7：元素a放到数组中，指向原来的元素。
jdk8：原来的元素在数组中，指向元素a
总结：七上八下

4.1 Set接口中没有额外定义新的方法，使用的都是Collection中声明过的方法。

4.2 要求：

重写的hashCode()和equals()尽可能保持一致性：相等的对象必须具有相等的散列码
重写两个方法的小技巧：对象中用作equals()方法比较的Field，都应该用来计算hashCode值

为什么重写hashCode方法，有31这个数字？

1，选择系数的时候要选择尽量大的系数，因为如果计算出来的hash地址越大，所谓的"冲突"就越少，查找起来效率也会提高。（减少冲突）

2，并且31只占用5bits，相乘造成数据溢出的概率较小。

3，31可以由i*31 == (i << 5)-1来表示，现在很多虚拟机里面都有做相关优化。（提高算法效率）

4，31是一个素数，素数作用就是如果我用一个数字来乘以这个素数，那么最终出来的结果只能被素数本身和被乘数还有1来整除！（减少冲突）

Tommey01

发布了67 篇原创文章 · 获赞 19 · 访问量 9874

私信关注

面试中的Collection集合————源码分析

猜你喜欢