Java集合：ArrayList （JDK1.8 源码解读）

ArrayList

ArrayList几乎是每个java开发者最常用也是最熟悉的集合，看到ArrayList这个名字就知道，它必然是以数组方式实现的集合

关注点

说一下ArrayList的几个特点，也是面试喜欢问的几个点：

1.是否允许为空：是

2.是否允许重复数据：是

3.是否有序：是

4.是否线程安全：否

主要声明

扫描二维码关注公众号，回复： 7126900 查看本文章

看一下ArrayList的声明：

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable

ArrayList继承自AbstractList，并且实现了List接口（还实现了RandomAccess、Cloneable、Serializable），List接口又继承自顶层集合接口Cellection，实现了List接口就代表它是一个有序的集合

再看一下ArrayList声明的主要变量：

// 默认容量
private static final int DEFAULT_CAPACITY = 10;

// 一个空的数组
private static final Object[] EMPTY_ELEMENTDATA = {};

// 默认容量的空数组，搞这么多空数组干嘛？|_・)
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

// ArrayList的核心，elemenData就是底层的数组
transient Object[] elementData;

// 数组所包含的元素数量
private int size;

这里做一下几个主要变量的说明：

1.DEFAULT_CAPACITY 并不是ArrayList的初始大小，只是默认大小

2.EMPTY_ELEMENTDATA和DEFAULTCAPACITY_EMPTY_ELEMENTDATA 就是两个空的对象数组，后面会在构造方法里面用到

3.ArrayList是基于数组的一个实现，elementData就是底层的数组

4.size数组所包含的元素的数量，ArrayList的size()方法返回的就是这个size的值

看完这些，我们来写个例子实际操作一下：

public static void main(String[] args)
{
    List<String> list = new ArrayList<>();
    //List<String> list = new ArrayList<>(10);
    list.add("111"); 
    list.add("222"); 
}

构造方法

1.无参构造器

public ArrayList() {
　　this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;// this(10)  jdk1.6写法
}

直接把声明的空数组丢给elementData，也就是说ArrayList在jdk1.8中初始化的时候大小是0，并不是10，这和jdk1.6有区别

2.带初始化容量大小的构造器，上面例子中注释掉的代码的用法

public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

传递一个int类型的参数initialCapacity作为ArrayList的初始化大小，如果initialCapacity大于0，则声明一个initialCapacity大小的对象数组给elementData赋值，如果initialCapacity为0就把声明的空对象数组给elementData，如果小于0你懂的

3. 还有一种构造器例子中未展示的 public ArrayList(Collection<? extends E> c) 传一个集合进去，也比较简单就是把集合转成数组赋值给elementData

添加元素

照着例子继续往下看，添加元素的时候，ArrayList会做什么，看看add的源码：

 1 public boolean add(E e) {
 2     ensureCapacityInternal(size + 1); 
 3     elementData[size++] = e;
 4     return true;
 5 }   
 6 
 7 private void ensureCapacityInternal(int minCapacity) {
 8      if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
 9          minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
10      }
11      ensureExplicitCapacity(minCapacity);
12 }
13 
14 private void ensureExplicitCapacity(int minCapacity) {
15      modCount++;
16      if (minCapacity - elementData.length > 0)
17          grow(minCapacity);
18 }

第二行代码是扩容用的我们先不管，直接看第三行，第三行告诉我们再调用add方法往集合里面添加元素的时候只是给对象数组加了一个元素而已，画图来说明一下

扩容

new ArrayList()的时候构造方法只给了一个DEFAULTCAPACITY_EMPTY_ELEMENTDATA声明的空对象数组，为什么例子的add方法的第三行还能执行往elementData里面添加元素，那么扩容就出现了

看第七行的ensureCapacityInternal(int minCapacity)方法（注：size表示数组内元素个数，那么我要往数组添加一个元素，minCapacity就是数组执行添加时最小需要的容量），执行add("111")，ArrayList的size初始值为0，那么minCapacity的值就为1，看第8行此时elementData是不是就是那个空的对象数组DEFAULTCAPACITY_EMPTY_ELEMENTDATA,

继续往下，把minCapacity赋值为minCapacity和默认容量两者的最大值，minCapacity的值就成了10，然后minCapacity最小容量和数组长度去比较，数组的长度已经不能满足添加元素后的最小容量，数组就会去执行扩容的grow(minCapacity)方法进行数组扩容，所以ArrayList触发扩容的条件就是数组长度不够了或者说数组已经装满了，看一下grow方法具体：

1 private void grow(int minCapacity) {
2      int oldCapacity = elementData.length;
3      int newCapacity = oldCapacity + (oldCapacity >> 1);
4      if (newCapacity - minCapacity < 0)
5          newCapacity = minCapacity;
6      if (newCapacity - MAX_ARRAY_SIZE > 0)
7          newCapacity = hugeCapacity(minCapacity);
8      elementData = Arrays.copyOf(elementData, newCapacity);
9 }

简单的说一下，第三行：新的数组长度=原数组长度 + 原数组长度的一半，这里使用的位运算>>1 ，oldCapacity是偶数就是一半，基数就是(oldCapacity-1)/2，因为长度必须得是整数，jdk1.6中使用的是 newCapacity = (oldCapacity * 3)/2 + 1，所以当别人问你ArrayList每次扩容多少时，你可以说扩容了二分之一的大小

问题：至于为什么要扩容二分之一？

可以看第八行代码，当确定了新数组长度之后，会把旧的elementData复制到一个新的长度为newCapacity的数组中去然后赋值给原来的elementData数组，如图

1.如果扩容的太少，则必须频繁的进行扩容操作，频繁的复制数组这必然会降低效率

2.如果扩容的太多，数组内就会有很多空闲的位置，就会造成空间上的浪费

所以JDK的开发人员必定是经过考量和权衡才会决定扩容的大小

插入元素

ArrayList在进行插入操作的时候也是使用的add方法，举个例子：

1     List<String> list = new ArrayList<>();
2     list.add("11"); 
3     list.add("33"); 
4     list.add("44");
5     list.add("55");
6     list.add(2,"22");//插入元素

第六行便是往ArrayList里面插入元素，看一下list.add(2,"22")执行的操作：

1 public void add(int index, E element) {
2     rangeCheckForAdd(index);
3 
4     ensureCapacityInternal(size + 1); 
5     System.arraycopy(elementData, index, elementData, index + 1,size - index);
7     elementData[index] = element;
8     size++;
9 }

先检查插入的下标是否小于0或者大于数组内元素的个数，如果不在这个范围内抛出数组下标越界IndexOutOfBoundsException

判断下标合法性之后和添加元素一样判断是否需要扩容，然后按照下标指定的位置，把elementData数组内从指定位置开始的所有元素利用System.arraycopy方法做一个整体复制，向后移动一个位置，并且为指定下标位置插入对应的元素，画图表示一下这个过程：

删除元素

ArrayList提供了两种删除元素的方法：

1.通过指定下标删除

2.通过指定元素删除

先看第一种：

 1 public E remove(int index) {
 2     rangeCheck(index);
 3 
 4     modCount++;
 5     E oldValue = elementData(index);
 6 
 7     int numMoved = size - index - 1;
 8     if (numMoved > 0)
 9         System.arraycopy(elementData, index+1, elementData, index,
10                              numMoved);
11     elementData[--size] = null; // clear to let GC do its work
12 
13     return oldValue;
14}

同样的先检查指定下标的合法性，是否在可删除范围内，记录要删除的元素，return的时候返回删除的元素，然后获取需要复制的数组长度，除非你指定删除的位置就是数组的最后一个元素，否则就是同样的套路，复制指定下标+1位置开始的元素，向前移动一个位置，并且给数组元素最后一个元素赋值null，让GC来回收它，来个图表示一下：

再来看第二种按照元素删除：

 1 public boolean remove(Object o) {
 2         if (o == null) {
 3             for (int index = 0; index < size; index++)
 4                 if (elementData[index] == null) {
 5                     fastRemove(index);
 6                     return true;
 7                 }
 8         } else {
 9             for (int index = 0; index < size; index++)
10                 if (o.equals(elementData[index])) {
11                     fastRemove(index);
12                     return true;
13                 }
14         }
15      return false;
16 }

遍历数组寻找匹配的元素，只不过元素为null的时候使用的==判断其他类型都使用equals方法判断，如果匹配了就执行fastRemove，fastRemove干了啥呢？

1 private void fastRemove(int index) {
2         modCount++;
3         int numMoved = size - index - 1;
4         if (numMoved > 0)
5             System.arraycopy(elementData, index+1, elementData, index,
6                              numMoved);
7         elementData[--size] = null; // clear to let GC do its work
8     }

这不就是按照下标删除的操作吗？所以这两种删除方式的差别就是第一种返回被删除的元素，第二种删除匹配元素返回true，没有匹配元素返回false

到这里ArrayList的基本操作就讲完了，总结一下：

ArrayList的优点：

1.ArrayList层是数组实现的，支持随机访问，并且实现了RandomAccess接口，所以查找数据非常快

2.顺序添加非常快，只是往数组尾部添加了一个元素

3.从尾部删除也非常方便，只是把最后一个元素变成了null，等待GC回收

ArrayList的缺点：

1.如果从中间插入元素或者删除元素会涉及到数组元素的复制，如果复制的元素太多非常耗费性能

2.ArrayList的底层数组是个动态数组，大小会随着元素的增加而进行扩容，扩容涉及到数组元素的复制，会消耗性能和空间，所以如果在使用ArrayList的时候能确定或者大概知道数据量大小，在new ArrayList的时候请一个合理的初始化大小，避免频繁扩容

总的来说ArrayList适合顺序添加，随机访问的使用场景

ArrayList和Vector的区别

ArrayList里面的方法都不是线程同步的，所以ArrayList的线程是不安全的，在多线程情况下会有线程安全问题，可以使用Collections.synchronizedList方法把你的ArrayList变成一个线程安全的List

List<String> synchronizedList = Collections.synchronizedList(list);

还有一种方法就是使用Vector，Vector和ArrayList的实现方式几乎一样，只不过Vector的大部分public方法都是加了synchronized，ArrayList和Vector主要有两个区别：

1.Vector线程安全

2.Vector可以指定增长因子，扩容的时候原数组会增加增长因子个大小，如果增长因子缺省那么就会增加一倍的大小

int newCapacity = oldCapacity + ((capacityIncrement > 0) ? capacityIncrement : oldCapacity);

Java集合：ArrayList （JDK1.8 源码解读）

猜你喜欢