java深入学习之ArrayList工作原理

ArrayList应该是我们使用得比较频繁的一个集合类了。它主要特点包括:
1.自动扩容,也就是常说的动态数组;
2.可以添加任何类型的对象,包括null;
3.随机访问元素速度快;
4.非安全的集合类,也就是不同步的;
如果你已经清楚ArrayList的底层数据结构、自动扩容的实现原理以及它的一些常用方法的具体实现,那么你就没有必要往下阅读了。

ArrayList的数据结构

ArrayList有三个构造函数,分别是ArrayList()、ArrayList(int initialCapacity) 和 ArrayList(Collection

 /**
     * Constructs an empty list with an initial capacity of ten.
     */
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

其中elementData 就是一个object数组定义,

transient Object[] elementData;

DEFAULTCAPACITY_EMPTY_ELEMENTDATA也是一个默认的object空数组,

private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

也就是说,这里只是构建一个空数组,但是我们的大java怎么会犯这种错呢?肯定还有后文,接下看就对了。
ArrayList(int initialCapacity):

   public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

这里也就是初始化了一个数组。好的,接下来看ArrayList(Collection

    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

这个构造函数主要作用就是将一个Collection类中的元素换成ArrayList形式存储。

ArrayList常用方法

1.存储数据

 1. set(int index, E element)、 
 2. add(E e)、
 3. add(int index, E element)、
 4. addAll(Collection<? extends E> c)、 
 5. addAll(int index, Collection<?extends E> c)

我们主要看set和add就好了,

  public E set(int index, E element) {
        rangeCheck(index);

        E oldValue = elementData(index);
        elementData[index] = element;
        return oldValue;
    }

首先是rangeCheck方法判断index是否大于数组的大小,然后就是元素的替换。接下来看add方法:

  public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }

这里需要注意的是ensureCapacityInternal(size+1),前面也说到了ArrayLisy()构造函数返回一个空数组的问题,那么请看:

 private void ensureCapacityInternal(int minCapacity) {
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
            minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
        }

        ensureExplicitCapacity(minCapacity);
    }

也就是说添加元素时首先会判断数组是不是空对象,然后会判断minCapacity和DEFAULT_CAPACITY的值,取其中最大的,而DEFAULT_CAPACITY默认为10,也就是数组的默认大小10,那么接着看ensureExplicitCapacity(minCapacity),

  private void ensureExplicitCapacity(int minCapacity) {
        modCount++;

        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

这里首先会判断请求的数组大小是否大于当前的数组大小,然后执行grow()函数,我们重点看grow(minCapacity)函数,这里会不会就是我们前面说的扩容呢?答案是肯定的。

ArrayList的扩容

 private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

从上述代码中可以看出,数组进行扩容时,首先会增长1.5倍,如果增长后的长度还是小于minCapacity,那么就会取最新的数组的长度为minCapacity,如果minCapacity过大,则会赋值最大的Interage值。另外还要进行一次数组拷贝操作,这种操作的代价是很高的,也就是为什么建议我们在使用时最好预估数组的长度。

ArrayList其他常用函数

get():

public E get(int index) {
        rangeCheck(index);

        return elementData(index);
    }

首先是检查数组是否越界,然后就是普通的返回某个对象的方法。
remove():

    public E remove(int index) {
        rangeCheck(index);

        modCount++;
        E oldValue = elementData(index);

        int numMoved = size - index - 1;
        if (numMoved > 0)
            System.arraycopy(elementData, index+1, elementData, index,
                             numMoved);
        elementData[--size] = null; // clear to let GC do its work

        return oldValue;
    }

首先是判断要删除的元素的坐标是否越界,并且让数组最后的元素置null,让gc回收。其中ArrayList还有一个remove()函数是根据对象来进行删除的,由于ArrayList允许重复元素,所以其实删除的是首次添加的对象:

 public boolean remove(Object o) {
        if (o == null) {
            for (int index = 0; index < size; index++)
                if (elementData[index] == null) {
                    fastRemove(index);
                    return true;
                }
        } else {
            for (int index = 0; index < size; index++)
                if (o.equals(elementData[index])) {
                    fastRemove(index);
                    return true;
                }
        }
        return false;
    }

由于ArrayList允许null,所以会分两种情况,但其实实现和上一个remove()函数类似。
还有一些其他的方法也是比较简单的,这里就不一一列举了,有兴趣可以去看看具体实现。

猜你喜欢

转载自blog.csdn.net/lks1139230294/article/details/73060896