Java集合框架（四）Map

Map

先看下map的类图:

我们主要学习HashMap,LinkedHashMap,Hashtable,WeakedHashMap和TreeMap。

1.map介绍

map在java中用来保存具有映射关系的数据，以键值对的形式保存，一个key对应一个value，key不可以重复。可以把map中的key部分看成一个set集合，无序不重复，把value部分看成是一个list集合，都可以通过索引来进行访问，只不过这里的索引不是数字下标而是map中的key。

2.map主要实现和基本用法

map和set的实现结构基本相同，从两者的类图中也可以看出来。事实上java中就是先有得map集合，再有得set集合，set集合是被当成一个value全都是null的map集合。

HashMap：(使用最多的实现类)

测试代码：

package com.ljw.ColleactionAndMap;

import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;

/**
 * Created by liujiawei on 2018/6/30.
 */
public class TestMap {
    public static void main(String[] args) {
        HashMap hashMap = new HashMap();

        hashMap.put(null,1);
        hashMap.put(null,2);
        hashMap.put("jack","jack");
        hashMap.put("tom","tom");
        hashMap.put("jak","jack");
        hashMap.put(2,"2");
        hashMap.put(1,"1");


        System.out.println(hashMap);

        System.out.println(hashMap.keySet());  //以集合形式获取map的所有key

        System.out.println(hashMap.get(1));


        System.out.println("是否保存'33'的key===" + hashMap.containsKey("33"));

        System.out.println("是否保存'33'的value===" + hashMap.containsValue("33"));

        System.out.println(hashMap.entrySet());  //以集合形式获取map中的entry

        //迭代hashmap的4中常见方式

        //1.通过迭代器迭代entryset
        System.out.println("通过迭代器迭代entryset");
        Iterator it = hashMap.entrySet().iterator();
        while(it.hasNext()){
            Map.Entry entry = (Map.Entry) it.next();
            System.out.println(entry.getKey() + "====" + entry.getValue());
        }


        //2。for循环entryset  推荐
        System.out.println("推荐使用for循环entryset");
        for (Object o:hashMap.entrySet()) {
            Map.Entry<Object,Object> entry = (Map.Entry<Object, Object>) o;
            System.out.println(entry.getKey() + "====" + entry.getValue());
        }
        

        //3.遍历key获取values
        System.out.println("遍历key获取values");
        for (Object o:hashMap.keySet()) {
            System.out.println(o + "===" + hashMap.get(o));
        }

        //4。遍历value
        System.out.println("遍历value");
        for (Object o:hashMap.values()) {
            System.out.println(o);
        }


    }
}

运行结果：

通过上面的结果可以看到，hashmap中支持插入null作为key，key是唯一的，插入重复的key时，后插入的value会代替之前的value。我们还注意到插入的顺序和我们输出的顺序不一致，这是因为HashMap在插入key时，会通过计算hashcode来自己确定存储位置，所以是无序的。HashMap还可以以集合的形式返回所有的key，通过HashMap的keySet()可以对map的对象进行迭代。通过get（Object key）方法，可以获取到对应的value。

LinkedHashMap：

测试代码：

package com.ljw.ColleactionAndMap;

import java.util.LinkedHashMap;

/**
 * Created by liujiawei on 2018/7/2.
 */
public class TestLinkedHashMap {
    public static void main(String[] args) {
        LinkedHashMap linkedHashMap = new LinkedHashMap();

        linkedHashMap.put(null,1);
        linkedHashMap.put(null,2);
        linkedHashMap.put("jack","jack");
        linkedHashMap.put("tom","tom");
        linkedHashMap.put("jak","jack");
        linkedHashMap.put(2,"2");
        linkedHashMap.put(1,"1");

        System.out.println(linkedHashMap);

    }
}

运行结果：

LinkedHashMap在HashMap的基础上，通过链表来维护插入的key的顺序，保证放入和取出的顺序是一致的。

因为需要维护插入的顺序，所以性能上没有HashMap好。

Hashtable：

Hashtable和HashMap的用法基本相同，区别在于Hashtable是线程安全的，不支持null作为key。

WeakedHashMap：

WeakedHashMap和HashMap的用法相同，区别的是WeakedHashMap中放的是弱引用（java引用相关参考）
我们用代码看下是什么意思：
测试代码：

package com.ljw.ColleactionAndMap;

import java.util.WeakHashMap;

/**
 * Created by liujiawei on 2018/7/2.
 */
public class TestWeakedHashMap {
    public static void main(String[] args) {
        WeakHashMap weakHashMap = new WeakHashMap();
        weakHashMap.put(new String("jack"),"jack");
        weakHashMap.put(new String("tom"),"tom");
        weakHashMap.put(new String("pony"),"pony");

        System.out.println(weakHashMap);
        System.gc();
        System.out.println(weakHashMap);

        String tony = "tony";
        weakHashMap.put(tony,tony);
        System.gc();
        System.out.println(weakHashMap);


    }
}

运行结果：

可以看到第一次放入的三个数据，在调用了System.gc()以后，全都被回收了，最后增加的数据保留了下面，这就是因为上面三个全都属于弱引用，最后那个则是强饮用。

*使用WeakedHashMap时，里面要注意全都是弱引用，否则就失去了使用它的意义。

TreeMap：

对照TreeSet, TreeSet内部通过红黑树来存储数据，要求插入的对象都实现compator接口，依次来保证内部元素处于有序状态。TreeMap也是通过红黑树实现了内部对象的排序。我们用代码看下：

package com.ljw.ColleactionAndMap;

import java.util.Comparator;
import java.util.TreeMap;

/**
 * Created by liujiawei on 2018/7/2.
 */
public class TestTreeMap {
    public static void main(String[] args) {
        TreeMap treeMap = new TreeMap();
        treeMap.put(1,1);
        treeMap.put(2,1);
        treeMap.put(3,1);
        treeMap.put(4,1);
        System.out.println(treeMap);


        TreeMap treeMap1 = new TreeMap(new Comparator() {
            @Override
            public int compare(Object o1, Object o2) {
                int a = (int) o1;
                int b = (int) o2;
                if(a < b)
                    return 1;
                if(a == b)
                    return 0;
                if(a > b)
                    return -1;
                return 0;
            }
        });

        treeMap1.put(1,1);
        treeMap1.put(2,1);
        treeMap1.put(3,1);
        treeMap1.put(4,1);
        System.out.println(treeMap1);


    }
}

运行结果：

和TreeSet一样，TreeMap中的对象需要实现Compator接口，否则无法进行排序，抛出异常。

在实例化时，通过内部类直接重写compare（）方法，可以实现定制排序的效果。

*除非需要map中的对象总是处于有序状态，此时选择TreeMap，其他时候就应该尽量使用其他集合，因为排序会额外消耗时间。

3.HashMap和Hashtable底层分析（jdk1.7）

HashMap：

我们从HashMap的源码中来分析下HashMap初始化/新增／扩容这三个过程。

初始化：

先记住这三个参数，后面会介绍这三个用途。

默认容量：16

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

默认加载因子：0.75f

static final float DEFAULT_LOAD_FACTOR = 0.75f;

扩容因子：

int threshold;

HashMap的三个构造方法，其实调用的都是最后一个：

public HashMap() {
    this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);
}

    this(initialCapacity, DEFAULT_LOAD_FACTOR);
}

public HashMap(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);

    this.loadFactor = loadFactor;
    threshold = initialCapacity;
    init();
}

我们直接看最后一个构造方法，我们可以看到在这个方法里面没有生成任何对象，只是对初始化容量initialCapacity，加载因子loadFactory还有扩容因子threshold做了简单的赋值。

这里的init（）方法是留给HashMap的子类实现的，这里没有任何实际意义。

新增：

HashMap中的新增对象都是通过put（key,value）方法来实现，它是以什么形式存储数据的，null是怎么处理的，重复的key是怎么判断的，都在这个put（）方法中实现，我们一起看下这部分的源码：

public V put(K key, V value) {
    if (table == EMPTY_TABLE) {
        inflateTable(threshold);
    }
    if (key == null)
        return putForNullKey(value);
    int hash = hash(key);
    int i = indexFor(hash, table.length);
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }

    modCount++;
    addEntry(hash, key, value, i);
    return null;
}

transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;

table是HashMap中的声明的一个Entry类型的数组，这个对象是map中的一个内部实现类，用于保存key-value这种键值对类型的数据。

看下inflateTable（）这个方法，inflate是膨胀的意思，可以看出，这就是给table初始化的方法：

private void inflateTable(int toSize) {
    // Find a power of 2 >= toSize
    int capacity = roundUpToPowerOf2(toSize);

    threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
    table = new Entry[capacity];
    initHashSeedAsNeeded(capacity);
}

在HashMap中，数组的容量总是2的次幂，这是因为2的次幂在计算机中运行效率最高，扩容因子在这里被重新赋值，具体计算就是容量*加载因子。这个数值将用来判断何时需要扩容Entry数组。根据计算出的容量，完成对table的初始化，默认是一个大小为16的数组。
继续看下，put（）方法，可以看到HashMap之所以支持null作为key，就是它对null做了特殊处理，看下putForNullKey（）方法：

private V putForNullKey(V value) {
    for (Entry<K,V> e = table[0]; e != null; e = e.next) {
        if (e.key == null) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
    modCount++;
    addEntry(0, null, value, 0);
    return null;
}

可以看到，当key是null，会去table第一个位置找对应的数据，如果有的话，新的value会替代原有的value放在第一个位置，同时返回老得value。可以for循环有个判断条件是e = e.next，我们继续往下看：

int hash = hash(key);
int i = indexFor(hash, table.length);
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
    Object k;
    if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
        V oldValue = e.value;
        e.value = value;
        e.recordAccess(this);
        return oldValue;
    }
}

modCount++;
addEntry(hash, key, value, i);
return null;

可以看到非null类型的key处理步骤其实和null差不多，都是计算key的hash值，找到对应的存储位置来进行操作，这里的e.next是用来查询链表中的下一个数据，这涉及到HashMap内部的存储，用一个图说明下HashMap的存储：

HashMap内部使用数组来存储数据，这个数组是一个链表数组，里面存放Entry对象，Entry有三个属性，hash，key，value，key和value就是我们放进map的数据，hash则是通过hash（object）方法计算出的hashcode，所以HashMap的存储过程是这样理解的：

我们put一个key，value进map，首先拿到这个key，通过hashcode找到对应位置的数据，这是一个链表，先比较链表中的第一个对象的value，看是否相同，是的话，替换value，返回老的value，不是则和链表的下一个数据进行比较。

扩容：

我们已经知道，put（key，value），最后其实执行的操作就是addEntry(hash,key,value)，我们对table进行的扩容也是在这个方法中进行的：

void addEntry(int hash, K key, V value, int bucketIndex) {
    if ((size >= threshold) && (null != table[bucketIndex])) {
        resize(2 * table.length);
        hash = (null != key) ? hash(key) : 0;
        bucketIndex = indexFor(hash, table.length);
    }

    createEntry(hash, key, value, bucketIndex);
}

通过比较数组中已占用的空间和扩容因子，如果已占用的大小已经大于等于扩容因子了，那么直接在原有大小的基础上扩展一倍的空间。

Hashtable：

Hashtable和Vector一样，也是从最初的jdk就存在的一个集合，命名甚至都没有遵守驼峰命名的规则，现在基本不再使用这个集合，但是从研究的角度还是有必要了解下的：

初始化：

看下Hashtable的有关构造函数：

public Hashtable() {
    this(11, 0.75f);
}

	public Hashtable(int initialCapacity) {
    this(initialCapacity, 0.75f);
}

public Hashtable(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal Load: "+loadFactor);

    if (initialCapacity==0)
        initialCapacity = 1;
    this.loadFactor = loadFactor;
    table = new Entry[initialCapacity];
    threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
    initHashSeedAsNeeded(initialCapacity);
}

可以看到，Hashtable在实例化的过程中就对table对象完成了初始化过程，默认容量为11，加载因子也是0.75f。

新增：

public Hashtable(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal Load: "+loadFactor);

    if (initialCapacity==0)
        initialCapacity = 1;
    this.loadFactor = loadFactor;
    table = new Entry[initialCapacity];
    threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
    initHashSeedAsNeeded(initialCapacity);
}
可以看到，Hashtable在实例化的过程中就对table对象完成了初始化过程，默认容量为11，加载因子也是0.75f。
新增：
public synchronized V put(K key, V value) {
    // Make sure the value is not null
    if (value == null) {
        throw new NullPointerException();
    }

    // Makes sure the key is not already in the hashtable.
    Entry tab[] = table;
    int hash = hash(key);
    int index = (hash & 0x7FFFFFFF) % tab.length;
    for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) {
        if ((e.hash == hash) && e.key.equals(key)) {
            V old = e.value;
            e.value = value;
            return old;
        }
    }

    modCount++;
    if (count >= threshold) {
        // Rehash the table if the threshold is exceeded
        rehash();

        tab = table;
        hash = hash(key);
        index = (hash & 0x7FFFFFFF) % tab.length;
    }

    // Creates the new entry.
    Entry<K,V> e = tab[index];
    tab[index] = new Entry<>(hash, key, value, e);
    count++;
    return null;
}

可以看到，Hashtable之所以不支持null作为key，就是因为在新增的代码中对null做了处理，直接抛出了异常。

后面的插入以及扩容操作基本大同小异。

4.map集合比较

HashMap,LinkedHashMap,TreeMap和Hashtable这四个的使用，可以参考以下：

（1） HashMap是为了快速查询而设计的，当需要使用map集合时，如果没有特殊需求，首选HashMap；
（2）LinkedHashMap作为HashMap的子类，额外通过链表来对插入的数据做了管理，使得插入和取出的顺序相同，在迭代查询上有优势，插入删除操作还是HashMap更好；
（3）TreeMap使用红黑树，使得内部数据总是处于排序状态，但是这耗费了额外的性能，如果没有这个排序的需要，尽量不要使用TreeMap；
（4）需要线程安全，可以使用Hashtable.