谈谈Java容器-ArrayList

ArrayList是面试中常见的Java容器,也算是Java中比较简单的容器,我们今天就来讲讲ArrayList的源码和常见的面试点。

概述

ArrayList是一种底层基于数组实现的容器,并且能够实现随元素数量增加而进行动态扩容。与LinkedList相比,ArayList非常适合于查找元素,原因在于ArrayList底层实现原理是数组存储的内存在物理上是连续的,但增加和删除元素时,ArrayList比起LinkedList就比较慢了。此外,ArrayList时线程不安全的容器,要使用线程安全的集合容器,可以使用Vector。Vector实现线程安全的方式非常简单,直接在方法上加上了synchronized同步锁。ArrayList也可以通过Collections.synchronizedList将ArrayList包装一层同步锁实现线程安全,原理同Vector。

ArrayList初始化分析

鉴于源码内容较长,我们在这里先对ArrayList的几种构造方法进行解读,以下是JDK8中与构造方法相关的部分源码。

public class ArrayList<E> extends AbstractList<E> implements List<E>, RandomAccess, Cloneable, java.io.Serializable {

    private static final Object[] EMPTY_ELEMENTDATA = {};

    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

    transient Object[] elementData;

    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }
}

观察一下上面的代码,首先是无参构造方法。我们看到,在该方法中,elementData被赋予了一个空数组,而这里是JDK6和之后的JDK之间一个比较大的区别。下面是JDK6的构造方法源码,我们可以发现在JDK6中的无参构造方法直接调用this(10)给数组容量初始化为10,而在那之后的版本中都是默认初始化为空数组。

public ArrayList(int initialCapacity) {
    super();
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    this.elementData = new Object[initialCapacity];
}


public ArrayList() {
    this(10);
}

对于有参构造函数ArrayList(int initialCapacity),只要初始化容量initialCapacity的值合适,就可以初始化适当大小的数组。
对于有参构造函数ArrayList(Collection<? extends E> c),先将传入的集合转化为数组,然后将数组长度赋值给size,如果长度为0,则将数组初始化为空数组,否则判断数组类型是否是Object[],如果不是就复制elementData中的元素转成Object[]数组给elementData

ArrayList添加元素

public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
}

我们来看一下默认的add(E e)添加元素的方法,我们看到在执行该方法时,会先调用ensureCapacityInternal(size + 1)检查添加一个元素之后是否需要扩容,然后将传入的元素添加到数组中,并增加数组的大小,最后返回true。接下来,我们要看看ensureCapacityInternal(int minCapacity)方法的具体源码。

private void ensureCapacityInternal(int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }

    ensureExplicitCapacity(minCapacity);
}

通过观察ensureCapacityInternal(int minCapacity)函数我们可以看到,ArrayList会首先判断elementData是不是默认的空数组,如果是的话,会比较DEFAULT_CAPACITY也就是10和minCapacity的大小,取较大的值赋给minCapacity。联系这里的源码我们可以知道,当一个ArrayList在无参构造方法不会初始化数组容量,只有在添加元素时,才会初始化数组容量,这里证实了我们前面说的和JDK6的不同之处。
接着往下看,我们看到这个方法又调用了ensureExplicitCapacity(int minCapacity)方法,我们继续往下看这个方法的源码。

private void ensureExplicitCapacity(int minCapacity) {
    modCount++;

    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
}

ensureExplicitCapacity(int minCapacity)中首先我们需要知道modCount的作用,它是ArrayList的父类AbstractList中的一个成员变量,是用来记录修改次数的,因为增加元素是修改操作,所以modCount++。接着代码判断minCapacity的值有没有超过数组的容量,如果超过了就调用grow(int minCapacity)进行扩容,继续看后面的源码…看到这里,相信小伙伴们快看吐了,说实话,我写到这儿都快写吐了,这一层又一层的调用,真是老千层饼了…

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
}

private static int hugeCapacity(int minCapacity) {
    if (minCapacity < 0) // overflow
        throw new OutOfMemoryError();
    return (minCapacity > MAX_ARRAY_SIZE) ?
        Integer.MAX_VALUE :
        MAX_ARRAY_SIZE;
}

在上面的grow(int minCapacity)中,oldCapacity是原来数组的容量,newCapacityoldCapacity的1.5倍,这里用到了位运算,不了解的同学可以先去学习一下位运算相关的知识。顺便提一下,在JDK6中,计算新容量大小的方法是int newCapacity = (oldCapacity * 3)/2 + 1。接着看源码,后面是对newCapacity范围做校验,如果比minCapacity小,则将minCapacity赋值给minCapacity,如果比MAX_ARRAY_SIZE大,就为数组赋一个超大容量。最后将数组元素复制到新的elementData中,也赋予新的容量newCapacity

看完了默认的元素添加方法,我们再看一下在指定位置添加元素的方法。

public void add(int index, E element) {
    rangeCheckForAdd(index);

    ensureCapacityInternal(size + 1);  // Increments modCount!!
    System.arraycopy(elementData, index, elementData, index + 1,
                     size - index);
    elementData[index] = element;
    size++;
}

private void rangeCheckForAdd(int index) {
    if (index > size || index < 0)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

其实和前面的默认添加元素方法没有太大区别,就是添加了一个下标校验防止越界。另外,还有将数组的index下标之后的元素拷贝到都向后移一位的操作,我们用图片解释一下这个操作。下图中,在下标为2的地方插入一个元素,那么从下标2开始的每一个元素都会向后移动,为插入的元素腾出一个位置。这也就解释了为什么ArrayList效率低的原因,这要是几亿、几十亿个数据都向后移动一位,那得多久啊…

扫描二维码关注公众号,回复: 11406619 查看本文章

arraycopy复制元素

ArrayList删除元素

public E remove(int index) {
    rangeCheck(index);

    modCount++;
    E oldValue = elementData(index);

    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
    elementData[--size] = null; // clear to let GC do its work

    return oldValue;
}

private void rangeCheck(int index) {
    if (index >= size)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

@SuppressWarnings("unchecked")
E elementData(int index) {
    return (E) elementData[index];
}

看完了前面添加元素的操作,删除操作就容易多了,首先是对下标值的范围校验,然后又是对数组的复制操作arraycopy。继续画个图方便大家理解。所以同理,删除操作效率也很低。

arraycopy删除元素

参考文献

《吊打面试官》系列-ArrayList

猜你喜欢

转载自blog.csdn.net/qq_32273417/article/details/106410514