java中HashMap、CurrentHashMap 工作原理&&和HashTable、HashSet的区别

HashMap和HashTable的区别

HashMap存储的是键值对（接受null键值对），不支持synchronized，速度很快；
HashTable不接受null键值对，可同步（Synchronized）

虽然HashMap是非Synchronized，但collection框架提供方法能保证HashMap synchronized，这样多个线程同时访问HashMap时，能保证只有一个线程更改Map。

另一个区别是HashMap的迭代器(Iterator)是fail-fast迭代器，而Hashtable的enumerator迭代器不是fail-fast的。所以当有其它线程改变了HashMap的结构（增加或者移除元素），将会抛出ConcurrentModificationException，但迭代器本身的remove()方法移除元素则不会抛出ConcurrentModificationException异常。但这并不是一个一定发生的行为，要看JVM。这条同样也是Enumeration和Iterator的区别。

HashMap不能保证随着时间的推移Map中的元素次序是不变的。

HashMap的工作原理

“HashMap是基于hashing的原理，我们使用put(key, value)存储对象到HashMap中，使用get(key)从HashMap中获取对象。当我们给put()方法传递键和值时，我们先对键调用hashCode()方法，返回的hashCode用于找到bucket位置来储存Entry对象。”
hashCode方法是返回地址，对应Entry对象。
也就是说HashMap是在bucket中存储键和值的对象，而不仅仅是键值对。

HashMap中的碰撞：

当两个对象的hashcode相同会发生什么？
因为hashcode相同，所以它们的bucket位置相同，‘碰撞’会发生，HashMap将会抛出异常，或者不会存储它们。
（即使两个对象不一定是equal）因为HashMap使用链表存储对象，这个Entry(包含有键值对的Map.Entry对象)会存储在链表中。

“如果两个键的hashcode相同，你如何获取值对象？”

当我们调用get()方法，HashMap会使用键对象的hashcode（key.hashcode()）找到bucket位置，然后获取值（value）对象。
如果有两个值对象储存在同一个bucket，将会遍历链表直到找到值对象。也就是找到bucket位置之后，遍历，调用keys.equals()方法去找到链表中正确的节点，最终找到要找的值对象。

**使用不可变的、声明作final的对象，并且采用合适的equals()和hashCode()方法的话，将会减少碰撞的发生，提高效率。**不可变性使得能够缓存不同键的hashcode，这将提高整个获取对象的速度，使用String，Interger这样的wrapper类作为键是非常好的选择。

如果HashMap的大小超过了负载因子(load factor)定义的容量，怎么办？

默认的负载因子大小为0.75，也就是说，当一个map填满了75%的bucket时候，和其它集合类(如ArrayList等)一样，将会创建原来HashMap大小的两倍的bucket数组，来重新调整map的大小，并将原来的对象放入新的bucket数组中。这个过程叫作rehashing，因为它调用hash方法找到新的bucket位置。

重新调整HashMap大小存在什么问题？？

当多线程的情况下，可能产生条件竞争(race condition)。

当重新调整HashMap大小的时候，确实存在条件竞争，因为如果两个线程都发现HashMap需要重新调整大小了，它们会同时试着调整大小。在调整大小的过程中，存储在链表中的元素的次序会反过来，因为移动到新的bucket位置的时候，HashMap并不会将元素放在链表的尾部，而是放在头部，这是为了避免尾部遍历(tail traversing)。如果条件竞争发生了，那么就死循环了。这个时候，你可以质问面试官，为什么这么奇怪，要在多线程的环境下使用HashMap呢？：）

不可变性

为什么String, Interger这样的wrapper类适合作为键？

String最为常用。因为String是不可变的，也是final的，而且已经重写了equals()和hashCode()方法了。
其他的wrapper类（Interger）也有这个特点。不可变性是必要的，因为为了要计算hashCode()，就要防止键值改变，如果键值在放入时和获取时返回不同的hashcode的话，那么就不能从HashMap中找到你想要的对象。

不可变性还有其他的优点如线程安全。如果你可以仅仅通过将某个field声明成final就能保证hashCode是不变的，那么请这么做吧。因为获取对象的时候要用到equals()和hashCode()方法，那么键对象正确的重写这两个方法是非常重要的。如果两个不相等的对象返回不同的hashcode的话，那么碰撞的几率就会小些，这样就能提高HashMap的性能。（减小碰撞几率，提高HashMap性能）

我们可以使用自定义的对象作为键吗？
你可能使用任何对象作为键，只要它遵守了equals()和hashCode()方法的定义规则，并且当对象插入到Map中之后将不会再改变了。如果这个自定义对象时不可变的，那么它已经满足了作为键的条件，因为当它创建之后就已经不能改变了。

我们可以使用CocurrentHashMap来代替Hashtable吗？
ConcurrentHashMap是java5提供的HashTable的替代，但是扩展性更好。
我们知道Hashtable是synchronized的，但是ConcurrentHashMap同步性能更好，因为它仅仅根据同步级别对map的一部分进行上锁**。ConcurrentHashMap当然可以代替HashTable，但是HashTable提供更强的线程安全性。**

部分转载自：http://www.importnew.com/7099.html

HashMap和HashTable的区别：http://www.importnew.com/7010.html

HashMap和HashSet的区别

Java集合大致可分为Set、List和Map三种体系，其中Set代表无序、不可重复的集合；List代表有序、重复的集合；而Map则代表具有映射关系的集合。Java 5之后，增加了Queue体系集合，代表一种队列集合实现。

Java集合框架主要由Collection（List Set Queue）和Map两个根接口及其子接口、实现类组成。
在这里插入图片描述
Map接口有两个基本的实现，HashMap和TreeMap。TreeMap保存了对象的排列次序，HashMap不可以。

HashSet类是Set接口的典型实现类。
特点：
1.不能保证元素的排列顺序，加入的元素要特别注意hashCode()方法的实现。
2.HashSet不是同步的，多线程访问同一步HashSet对象时，需要手工同步。
3.集合元素值可以是null。
在这里插入图片描述

ConcurrentHashMap 实现原理：锁分段技术

ConcurrentHashMap所使用的锁分段技术，首先将数据分成一段一段的存储，然后给每一段数据配一把锁，当一个线程占用锁访问其中一个段数据的时候，其他段的数据也能被其他线程访问。有些方法需要跨段，比如size()和containsValue()，它们可能需要锁定整个表而而不仅仅是某个段，这需要按顺序锁定所有段，操作完毕后，又按顺序释放所有段的锁。这里“按顺序”是很重要的，否则极有可能出现死锁，在ConcurrentHashMap内部，段数组是final的，并且其成员变量实际上也是final的，但是，仅仅是将数组声明为final的并不保证数组成员也是final的，这需要实现上的保证。这可以确保不会出现死锁，因为获得锁的顺序是固定的。

ConcurrentHashMap是由Segment数组结构和HashEntry数组结构组成。
Segment是一种可重入锁ReentrantLock，在ConcurrentHashMap里扮演锁的角色，HashEntry则用于存储键值对数据。
一个ConcurrentHashMap里包含一个Segment数组，Segment的结构和HashMap类似，是一种数组和链表结构，一个Segment里包含一个HashEntry数组，每个HashEntry是一个链表结构的元素，每个Segment守护着一个HashEntry数组里的元素,当对HashEntry数组的数据进行修改时，必须首先获得它对应的Segment锁。

与HashMap不同的是，ConcurrentHashMap使用多个子Hash表，也就是段(Segment)。

ConcurrentHashMap–>一个Segment数组（多个Segment段）
一个Segment段–>一个HashEntry数组

CurrentHashMap应用场景

当有一个大数组时需要在多个线程共享时就可以考虑是否把它给分层多个节点了，避免大锁。并可以考虑通过hash算法进行一些模块定位。
其实不止用于线程，当设计数据表的事务时（事务某种意义上也是同步机制的体现），可以把一个表看成一个需要同步的数组，如果操作的表数据太多时就可以考虑事务分离了（这也是为什么要避免大表的出现），比如把数据进行字段拆分，水平分表等。

CurrentHashMap的实现原理：http://www.cnblogs.com/ITtangtang/p/3948786.html