ArrayList 深入研究详解(Java源码解析)


ArrayList 是 java 中比较常用的数据结构了。继承自 AbstractList,实现了 List 接口、RandomAccess 接口、Cloneable 接口、Serializable 接口。底层基于数组实现容量大小动态变化、支持快速访问、复制、序列化、允许 null 值的存在。


1. 成员变量

1.1. 默认容量 DEFAULT_CAPACITY

默认初始容量大小为 10。

    /**
     *  默认初始容量。
     */
    private static final int DEFAULT_CAPACITY = 10;

1.2. 空元素数据 EMPTY_ELEMENTDATA

用于构造函数里面的。

    /**
     * 用于空实例的共享空数组实例。
     */
    private static final Object[] EMPTY_ELEMENTDATA = {
    
    };

1.3. 默认容量空元素数据 DEFAULTCAPACITY_EMPTY_ELEMENTDATA

用于构造函数里面的。

    /**
     * 第一次添加元素时知道该 elementData 从空的构造函数还是有参构造函数被初始化的。
     * 以便确认如何扩容。
     */
    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {
    
    };

1.4. 元素数据 elementData

ArrayList 底层是基于数组来实现容量大小动态变化的。

    /**
     * 存储ArrayList元素的数组缓冲区。
     * ArrayList的容量是此数组缓冲区的长度。
     * 当添加第一个元素时,
     * 任何elementData==DEFAULTCAPACITY_EMPTY_ELEMENTDATA的
     * 空ArrayList都将扩展为DEFAULT_CAPACITY 。
     */
    transient Object[] elementData; // 非私有以简化嵌套类访问

1.5. 容量 size

size 是指 elementData 中实际有多少个元素,而 elementData.length 为集合容量,表示最多可以容纳多少个元素。

    /**
     * ArrayList的大小(它包含的元素数)。
     * @serial
     */
    private int size;

2. 构造函数

2.1. 无参构造函数

当使用无参构造函数时是把 DEFAULTCAPACITY_EMPTY_ELEMENTDATA 赋值给 elementData。

    /**
     * 构造一个初始容量为10的空列表。
     */
    public ArrayList() {
    
    
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

构造函数了只是给 elementData 赋值了一个空的数组,其实是在第一次添加元素时容量扩大至 10 的。


2.2. 构造一个初始容量大小为 initialCapacity 的 ArrayList

当 initialCapacity 为零时则是把 EMPTY_ELEMENTDATA 赋值给 elementData, 当 initialCapacity 大于零时初始化一个大小为 initialCapacity 的 object 数组并赋值给 elementData。

    /**
     * 构造具有指定初始容量的空列表。
     *
     * @param  initialCapacity列表的初始容量
     * @throws 如果指定的初始容量为负,则抛出IllegalArgumentException异常
     */
    public ArrayList(int initialCapacity) {
    
    
        if (initialCapacity > 0) {
    
    
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
    
    
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
    
    
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

2.3. 指定 Collection 来构造 ArrayList 的构造函数

将 Collection 转化为数组并赋值给 elementData,把 elementData 中元素的个数赋值给 size。 如果 size 不为零,则判断 elementData 的 class 类型是否为 Object[],不是的话则做一次转换。 如果 size 为零,则把 EMPTY_ELEMENTDATA 赋值给 elementData,相当于new ArrayList(0)。

    /**
     * 按照集合迭代器返回元素的顺序,构造一个包含指定集合元素的列表。
     * @param 要将 C 的元素放入此列表的集合
     * @throws 如果指定的集合为null,则会抛出NullPointerException
     */
    public ArrayList(Collection<? extends E> c) {
    
    
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
    
    
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
    
    
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

3. 私有方法

先了解一下在ArrayList中会复用的方法及其作用

3.1. ensureCapacityInternal 方法

ensureCapacityInternal 方法 方法名翻译过来就是 确定容量,主要作用就是判断ArrayList是否需要扩容

    private void ensureCapacityInternal(int minCapacity) {
    
    
        ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
    }

ensureCapacityInternal 中调用了 ensureExplicitCapacity 方法和 calculateCapacity 方法


3.2. ensureExplicitCapacity 方法

ensureExplicitCapacity方法 方法名翻译过来就是 确定扩容方式,主要作用就是判断ArrayList扩容的方法。
ensureExplicitCapacity方法 中主要是调用的grow 方法,如果需要扩容modCount自增,这个参数是指当前列表的结构被修改的次数,判断当前数据量是否大于数组的长度,如果是,进行扩容。

    private void ensureExplicitCapacity(int minCapacity) {
    
    
        modCount++;
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }

3.3. calculateCapacity 方法

calculateCapacity 方法 方法名翻译过来就是 计算容量,主要作用就是计算容量。

    private static int calculateCapacity(Object[] elementData, int minCapacity) {
    
    
        if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
    
    
            return Math.max(DEFAULT_CAPACITY, minCapacity);
        }
        return minCapacity;
    }

注意:这里的 DEFAULTCAPACITY_EMPTY_ELEMENTDATA 并不是 EMPTY_ELEMENTDATA,不过并无太大差别,只是为了区分何时需要扩容而已 取其中最大的值作为判断本次是否需要扩容的依据,由于第一次数组是空的,所以默认要使数组扩容到10的长度。


3.4. grow方法

ensureExplicitCapacity方法 方法名翻译过来就是 扩大,就是ArrayList 的扩容方法。

    private void grow(int minCapacity) {
    
    
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

方法中会使用Arrays类的方法:copyOf()

	public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {
    
    
        @SuppressWarnings("unchecked")
        T[] copy = ((Object)newType == (Object)Object[].class)
            ? (T[]) new Object[newLength]
            : (T[]) Array.newInstance(newType.getComponentType(), newLength);
        System.arraycopy(original, 0, copy, 0,
                         Math.min(original.length, newLength));
        return copy;
    }

3.5. hugeCapacity方法

hugeCapacity方法 方法名翻译过来就是 巨大的容量,就是在新数组长度超过当前数组定义的最大长度时执行的方法。

    private static int hugeCapacity(int minCapacity) {
    
    
        if (minCapacity < 0) 
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

3.6. rangeCheckForAdd方法

rangeCheckForAdd方法 方法名翻译过来就是 添加时的容量检查,主要作用就是判断下标是否越界。

    private void rangeCheckForAdd(int index) {
    
    
	    if (index > size || index < 0)
	        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
	}

注意:如果下标越界则抛出IndexOutOfBoundsException异常。


3.7. rangeCheck方法

rangeCheckForAdd方法 方法名翻译过来就是 容量检查,主要作用就是判断下标是否越界。

	private void rangeCheck(int index) {
    
    
	    if (index >= size)
	        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
	}

注意:如果下标越界则抛出IndexOutOfBoundsException异常。

elementData方法

elementData方法 方法名翻译过来就是 元素数据,主要作用就是通过下标索引找到对应的元素值,返回指定元素。

	E elementData(int index) {
    
    
	    return (E) elementData[index];
	}

3.8. fastRemove方法

fastRemove方法 方法名翻译过来就是 快速删除,主要作用就是删除元素。
是ArrayList 的私有删除方法,跳过边界检查并且不返回删除的值。

	private void fastRemove(int index) {
    
    
	    modCount++;
	    int numMoved = size - index - 1;
	    if (numMoved > 0)
	        System.arraycopy(elementData, index+1, elementData, index,
	                         numMoved);
	    elementData[--size] = null; 
	}

方法中会通过 System.arraycopy 方法将后面的元素往前移动一位


4. 操作方法

操作方法多是基于私有方法的调用。

4.1. add 操作

每次添加元素到集合中时都会先确认下集合容量大小。然后将 size 自增 1。ensureCapacityInternal 函数中判断如果 elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA 就取 DEFAULT_CAPACITY 和 minCapacity 的最大值也就是 10。这就是 EMPTY_ELEMENTDATA 与 DEFAULTCAPACITY_EMPTY_ELEMENTDATA 的区别所在。使用无参构造函数时是在第一次添加元素时初始化容量为 10 的。ensureExplicitCapacity 中对 modCount 自增 1,记录操作次数,然后如果 minCapacity 大于 elementData 的长度,则对集合进行扩容。显然第一次添加元素时 elementData 的长度为零。

	// 添加单个元素,添加元素之前会先检查容量,如果容量不足则调用grow方法
	public boolean add(E e) {
    
    
	    // 判断添加后的长度是否需要扩容
	    ensureCapacityInternal(size + 1);  // Increments modCount!!
	    // 然后在数组末尾添加当前元素,并且修改size的大小
	    elementData[size++] = e;
	    // 返回布尔值true
	    return true;
	}
	public void add(int index, E element) {
    
    
	    //判断下标是否越界,如果是则抛出IndexOutOfBoundsException异常
	    rangeCheckForAdd(index);
		// 判断是否需要扩容,上面讲到过,这里不再解释
	    ensureCapacityInternal(size + 1);  // Increments modCount!!
	    // 拷贝数组,将下标后面的元素全部向后移动一位
	    System.arraycopy(elementData, index, elementData, index + 1,
	                     size - index);
	    // 将元素插入到当前下标的位置
	    elementData[index] = element;
	    size++;
	}

4.2. addAll 操作

	// 添加多个元素
	public boolean addAll(Collection<? extends E> c) {
    
    
	    return addAll(this.size, c);
	}
	// 添加多个元素到指定下标
	public boolean addAll(int index, Collection<? extends E> c) {
    
    
	    // 判断下标是否越界,上面提到过
	    rangeCheckForAdd(index);
	    // 判断c的大小是否大于0
	    int cSize = c.size();
	    // 如果等于0 返回 false
	    if (cSize==0)
	        return false;
	    checkForComodification();
	    // 将元素插入到数组中
	    parent.addAll(parentOffset + index, c);
	    // 将修改次数赋值给 modCount
	    this.modCount = parent.modCount;
	    // size大小加一
	    this.size += cSize;
	    return true;
	}

在进行 add 操作时先判断下标是否越界,是否需要扩容,如果需要扩容,就复制数组,然后设置对应的下标元素值。


4.3. get 操作

	// 先判断下标索引
	public E get(int index) {
    
    
	    // 调用rangeCheck判断是否超出了Object数组长度
	    rangeCheck(index);
	    // 调用 elementData 方法
	    return elementData(index);
	}

4.4. set 操作

	public E set(int index, E element) {
    
    
	    // 调用rangeCheck判断是否超出范围,上面讲到过,不懂的同学往上翻翻
	    rangeCheck(index);
	    // 返回指定元素,上面也讲到过
	    E oldValue = elementData(index);
	    elementData[index] = element;
	    return oldValue;
	}

4.5. remove 操作

	// 删除元素
	public E remove(int index) {
    
    
	    // 调用rangeCheck方法判断是否超出范围,上面讲到过
	    rangeCheck(index);
	    modCount++;
	    // 位置访问操作
	    E oldValue = elementData(index);
	    // 计算移除元素后需要移动的元素个数
	    int numMoved = size - index - 1;
	    if (numMoved > 0)
	        // 通过 System.arraycopy 方法将后面的元素往前移动一位
	        System.arraycopy(elementData, index+1, elementData, index,
	                         numMoved);
	    // 最后一位赋值为null
	    elementData[--size] = null; 
	    // 返回移除后元素的值
	    return oldValue;
	}
	// 删除对象
	public boolean remove(Object o) {
    
    
	    // 如果对象为null
	    if (o == null) {
    
    
	        // 遍历整个list去匹配移除的值
	        for (int index = 0; index < size; index++)
	            if (elementData[index] == null) {
    
    
	                fastRemove(index);
	                return true;
	            }
	    } else {
    
    
	        for (int index = 0; index < size; index++)
	            if (o.equals(elementData[index])) {
    
    
	                fastRemove(index);
	                return true;
	            }
	    }
	    return false;
	}

4.6. Iterator 操作

	// ArrayList中的迭代器
	public Iterator<E> iterator() {
    
    
	    // 主要返回一个Itr类
	    return new Itr();
	}

Iterator 方法返回的是Itr类,以下是 Itr类源码:

	private class Itr implements Iterator<E> {
    
    
	    int cursor;       // 下一个要返回的元素的索引
	    int lastRet = -1; // 返回的最后一个元素的索引; -1(如果没有)
	    int expectedModCount = modCount;
	    Itr() {
    
    }
	    // 判断是否还有下一个元素
	    public boolean hasNext() {
    
    
	        // 通过判断以下一个下标是否为数组大小,返回布尔值
	        return cursor != size;
	    }
	    @SuppressWarnings("unchecked")
	    // 获取下一个元素
	    public E next() {
    
    
	        // 调用checkForComodification方法检查修改的次数是否一致
	        checkForComodification();
	        // 定义下一个元素的下标
	        int i = cursor;
	        // 判断下标,如果下标大于ArrayList包含的元素个数
	        if (i >= size)
	            // 抛出 NoSuchElementException (没有这样的元素异常)异常
	            throw new NoSuchElementException();
	        // 定义elementData 为ArrayList的数组
	        Object[] elementData = ArrayList.this.elementData;
	        // 再次判断下标,如果此次判断不一致则说明数组被修改过
	        if (i >= elementData.length)
	            // 抛出 ConcurrentModificationException (并发修改)异常
	            throw new ConcurrentModificationException();
	        // 定义下一个元素的下标
	        cursor = i + 1;
	        // 将lastRet定义为下一个元素的下标(返回的最后一个元素的下标),然后返回下标对应的值
	        return (E) elementData[lastRet = i];
	    }
	
	    // 移除当前元素
	    public void remove() {
    
    
	        // 如果没有元素
	        if (lastRet < 0)
	            // 则抛出 IllegalStateException 异常
	            throw new IllegalStateException();
	        // 又来了,调用 checkForComodification,上面讲到过,用于判断修改次数是否一致
	        checkForComodification();
	        try {
    
    
	            // 调用ArrayList的remove方法
	            //如果在遍历外remove会导致Itr中的expectedModCount没有修改则抛出异常
	            ArrayList.this.remove(lastRet);
	            // 定义下一个元素的下标为当前下标
	            cursor = lastRet;
	            // 定义上个遍历下标为-1
	            lastRet = -1;
	            expectedModCount = modCount;
	        } catch (IndexOutOfBoundsException ex) {
    
    
	            throw new ConcurrentModificationException();
	        }
	    }
	}
	final void checkForComodification() {
    
    
	    // 判断当前Itr修改次数和ArrayList是否一致
	    if (modCount != expectedModCount)
	        // 不一致则抛出ConcurrentModificationException(并发修改异常)异常
	        throw new ConcurrentModificationException();
	}

5. 扩容机制

默认将扩容至原来容量的 1.5 倍。但是扩容之后也不一定适用,有可能太小,有可能太大。所以才会有下面两个 if 判断。如果1.5倍太小的话,则将我们所需的容量大小赋值给newCapacity,如果1.5倍太大或者我们需要的容量太大,那就直接拿 newCapacity = (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE : MAX_ARRAY_SIZE 来扩容(将扩容长度设置为Interger.MAX_VALUE,也就是int的最大长度)。然后将原数组中的数据复制到大小为 newCapacity 的新数组中,并将新数组赋值给 elementData。


6. 线程是否安全

注意:ArrayList不是线程安全的。
ArrayList不是线程安全的,所以效率较高,但是只能适用于单线程,多线程可以使用 Collections.synchronizedList(List list) 函数返回一个线程安全的 ArrayList 集合,或者使用 concurrent 并发包下的CopyOnWriteArrayLis。

使用Collections.synchronizedList(List list)方法实现线程安全

	List<?> list = Collections.synchronizedList(new ArrayList<>());

猜你喜欢

转载自blog.csdn.net/baidu_41847368/article/details/114382918
今日推荐