java深入学习之ArrayList工作原理

ArrayList应该是我们使用得比较频繁的一个集合类了。它主要特点包括：
1.自动扩容，也就是常说的动态数组；
2.可以添加任何类型的对象，包括null；
3.随机访问元素速度快；
4.非安全的集合类，也就是不同步的；
如果你已经清楚ArrayList的底层数据结构、自动扩容的实现原理以及它的一些常用方法的具体实现，那么你就没有必要往下阅读了。

ArrayList的数据结构

ArrayList有三个构造函数，分别是ArrayList()、ArrayList(int initialCapacity) 和 ArrayList(Collection

 /**
     * Constructs an empty list with an initial capacity of ten.
     */
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

其中elementData 就是一个object数组定义，

transient Object[] elementData;

DEFAULTCAPACITY_EMPTY_ELEMENTDATA也是一个默认的object空数组，

private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

也就是说，这里只是构建一个空数组，但是我们的大java怎么会犯这种错呢？肯定还有后文，接下看就对了。
ArrayList(int initialCapacity):

   public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

这里也就是初始化了一个数组。好的，接下来看ArrayList(Collection

    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

这个构造函数主要作用就是将一个Collection类中的元素换成ArrayList形式存储。

ArrayList常用方法

1.存储数据

 1. set(int index, E element)、 
 2. add(E e)、
 3. add(int index, E element)、
 4. addAll(Collection<? extends E> c)、 
 5. addAll(int index, Collection<?extends E> c)

我们主要看set和add就好了，

  public E set(int index, E element) {
        rangeCheck(index);

        E oldValue = elementData(index);
        elementData[index] = element;
        return oldValue;
    }

首先是rangeCheck方法判断index是否大于数组的大小，然后就是元素的替换。接下来看add方法：

  public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

这里需要注意的是ensureCapacityInternal（size+1），前面也说到了ArrayLisy（）构造函数返回一个空数组的问题，那么请看：

 private void ensureCapacityInternal(int minCapacity) {
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }

        ensureExplicitCapacity(minCapacity);
    }

也就是说添加元素时首先会判断数组是不是空对象，然后会判断minCapacity和DEFAULT_CAPACITY的值，取其中最大的，而DEFAULT_CAPACITY默认为10，也就是数组的默认大小10，那么接着看ensureExplicitCapacity(minCapacity)，

  private void ensureExplicitCapacity(int minCapacity) {
        modCount++;

        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

这里首先会判断请求的数组大小是否大于当前的数组大小，然后执行grow()函数，我们重点看grow（minCapacity）函数，这里会不会就是我们前面说的扩容呢？答案是肯定的。

ArrayList的扩容

 private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

从上述代码中可以看出，数组进行扩容时，首先会增长1.5倍，如果增长后的长度还是小于minCapacity，那么就会取最新的数组的长度为minCapacity，如果minCapacity过大，则会赋值最大的Interage值。另外还要进行一次数组拷贝操作，这种操作的代价是很高的，也就是为什么建议我们在使用时最好预估数组的长度。

ArrayList其他常用函数

get（）：

public E get(int index) {
        rangeCheck(index);

        return elementData(index);
    }

首先是检查数组是否越界，然后就是普通的返回某个对象的方法。
remove（）：

    public E remove(int index) {
        rangeCheck(index);

        modCount++;
        E oldValue = elementData(index);

        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work

        return oldValue;
    }

首先是判断要删除的元素的坐标是否越界，并且让数组最后的元素置null，让gc回收。其中ArrayList还有一个remove（）函数是根据对象来进行删除的，由于ArrayList允许重复元素，所以其实删除的是首次添加的对象：

 public boolean remove(Object o) {
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }

由于ArrayList允许null，所以会分两种情况，但其实实现和上一个remove（）函数类似。
还有一些其他的方法也是比较简单的，这里就不一一列举了，有兴趣可以去看看具体实现。