ArrayList的contains()方法的性能问题及优化方法

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/liu_005/article/details/80850171

  今天在项目性能测试过程中发现,某处代码通过ArrayList的contains()方法来检查某个给定值是否存在于该ArrayList中的性能非常低(该ArrayList中有10万个元素)。然后开始着手对其进行优化,下面主要介绍ArrayList的contains()方法的实现原理,以及优化后用来代替ArrayList的HashSet的contains()方法的实现原理,最后通过实例进行验证优化效果。

1. 原理说明

1.1 ArrayList

  ArrayList中contains()方法的实现过程:
这里写图片描述
  contains()方法调用了indexOf()方法,indexOf()具体实现如下。从源码可以看出,该方法通过遍历数据和比较元素的方式来判断是否存在给定元素。当ArrayList中存放的元素非常多时,这种实现方式来判断效率将非常低,后面通过实例来验证。
这里写图片描述

1.2 HashSet

  既然ArrayList的contains()方法存在性能问题,那么就应该寻找改进的办法。这里推荐使用HashSet来代替ArrayList。
  下面介绍HashSet的contains()方法的实现过程:

注:HashSet将元素存放在HashMap中(HashMap的key)

这里写图片描述
  contains()方法调用HashMap的containsKey()方法
这里写图片描述

  containsKey()方法调用getEntry()方法。在该方法中,首先根据key计算hash值,然后从HashMap中取出该hash值对应的链表(链表的元素个数将很少),再通过变量该链表判断是否存在给定值。这种实现方式效率将比ArrayList的实现方法效率高非常多。
这里写图片描述

2. 实例验证

2.1 测试ArrayList

代码:

public static void main(String[] args) {
    ArrayList<String> arrayList = new ArrayList<>();
    // 存入100000个数据
    for (int i = 0; i < 100000; i++) {
        arrayList.add("test" + i);
    }

    // 验证300000个数据(其中20000不存在)      
    long beginTime = System.currentTimeMillis();        for (int i = 0; i < 300000; i++) {
        arrayList.contains("test" + i);
    }
    long endTime = System.currentTimeMillis();

    System.out.println("cost time: " + (endTime - beginTime) + "ms");
}

打印结果:
cost time: 182210ms

2.2 测试HashSet

代码:

public static void main(String[] args) {

    Set<String> hashSet = new HashSet<>();
    // 存入100000个数据
    for (int i = 0; i < 100000; i++) {
        hashSet.add("test" + i);
    }

    // 验证300000个数据(其中20000不存在)
    long beginTime = System.currentTimeMillis();
    for (int i = 0; i < 300000; i++) {
        hashSet.contains("test" + i);
    }
    long endTime = System.currentTimeMillis();

    System.out.println("cost time: " + (endTime - beginTime) + "ms");
}

打印结果:
cost time: 49ms

3. 总结

  通过第二节的实例可以看出,使用ArrayList的contains()耗时是使用HashSet的contains()方法的30多倍。具体原因可以参考第一节中的原理分析。

猜你喜欢

转载自blog.csdn.net/liu_005/article/details/80850171