java虚拟机学习之（六）HotSpot虚拟机垃圾收集

java虚拟机学习之（五）垃圾收集器与垃圾回收算法（http://blog.csdn.net/qq_28044241/article/details/79520481）已经介绍了对象存活判定的算法和垃圾收集算法。下面将以HotSpot虚拟机为例，讲述真实情况下虚拟机垃圾回收的相关知识。

1.枚举根节点

从可达性分析中从GC Roots 节点找到引用链这个操作为例，可作为GC Roots的节点主要在全局性的引用（例如常量或者类静态属性）与执行上下文（例如栈帧中的本地变量表）中。现在很多应用仅仅方法区就有数百兆，如果逐个检查这里面的引用，那么必然会消耗很多的时间。

另外，可达性分析对执行时间的敏感还体现在GC停顿上，因为这项工作必须在一个能确保一致性（指的是整个分析期间整个执行系统看起来就像被冻结在某个时间节点上，不可以出现分析过程中对象引用关系还在不断变化的情况，该点不满足的话分析结果准确性就得不到保证。这个点是导致GC进行时必须停顿所有java执行线程的一个重要原因）的快照中进行。

由于目前主流的java虚拟机使用的都是准确式GC，所以当执行系统停顿下来以后，并不需要一个不漏的检查完所有执行上下文和全局的引用位置，虚拟机应当是有办法直接知道哪些地方存放着对象引用。在Hotspot中，是使用一组称为OopMap的数据结构来达到这个目的的，在类加载完成时，Hotspot就把对象内什么偏移量是什么类型的数据计算出来，在JIT的编译过程中，也会在特定位置记录下栈和寄存器中哪些位置是引用。这样在GC扫描时就可以直接得知这些信息了。

总结：

可作为GC Roots的节点主要在全局性的引用（如方法区中的常量表或者类的静态属性）与执行上下文（例如栈帧中的本地变量表）中。

因为如果逐个检查这些GC Roots，会消耗很长的时间，所以Hotspot采用了OopMap来存放对象引用，加快了检查的效率。

2.安全点

在OopMap的帮助下，Hotspot可以快速且准确的完成GC Roots的枚举，但一个很现实的问题随之而来：可能导致引用关系变化，或者说OopMap内容变化的指令非常多，如果为每一条指令都生成对应的OopMap，那将会需要大量的额外空间，这样GC的空间成本就会变得很高。

事实上，Hotspot也确实没有为每一条指令都生成OopMap，前面已经提到，只是在“特定的位置”记录了这些信息，这些位置称为安全点（SafePoint），即程序执行时并非在所有地方都停顿下来开始GC，只有在到达安全点时才能暂停。安全点的选定既不能太少以至于让GC等待时间太长，也不能过于频繁以至于过分增大运行时的负荷。所以，安全点的选定基本思想是以程序“是否具有让程序长时间执行的特性”为标准进行选定的——因为每条指令执行的时间都非常短暂，程序不太可能因为指令流长度太长这个原因而过长时间运行，“长时间执行”的最明显的特征就是指令序列复用，例如方法调用，循环跳转，异常跳转等，所以具有这些功能的指令才会产生SafePoint。

对于SafePoint，另一个需要考虑的问题是如何在GC发生时让所有线程（不包括执行JNI调用的线程）都“跑”到最近的安全点上再停顿下来。这里有两种方案可供选择：抢先试中断和主动式中断，其中抢先试中断不需要线程的执行代码主动去配合，在GC 发生时，首先把所有线程全部中断，如果发现有线程中断的地方不在安全点上，就恢复线程，让它“跑”到安全点上。现在几乎没有虚拟机采用抢先试中断来暂停线程从而响应GC事件。

而主动式中断的思想是当GC需要中断线程的时候，不直接对线程操作，仅仅简单的设置一个标志，各个线程执行时主动去轮询这个标志，发现中断标志为真时就自己中断挂起。轮询标志的地方和安全点时重合的，另外再加上创建对象需要分配内存的地方。

总结：为了减少OopMap的空间开销，Hotspot并非为每一条指令都生成OopMap，而是在SafePoint的位置记录这些信息。程序执行过程中，并非所有的地方都可以停顿下来GC，只有在SafePoint才能暂停。

中断方式：抢先式中断（先中断，再跑到安全点挂起）和主动式中断（轮询中断标志，标志为真时，线程自动挂起），现行虚拟机几乎没有采用抢先式中断的

3.安全区域

使用SafePoint似乎已经完美的解决了如何进入GC的问题，但实际情况却不一定，SafePoint 机制保证了程序执行时，在不太长的时间内就会遇到可以进入GC的safePoint。但是，程序“不执行”的时候呢？所谓的程序不执行就是没有分配CPU时间，典型的例子就是线程处于Sleep状态或者Blocked状态，这时候线程无法响应JVM的中断请求，“走”到安全点的地方去中断挂起，JVM也显然不太可能等待线程重新被分配CPU时间，对于这种情况，就需要安全区域（Safe Region）来解决。

安全区域是指在一段代码片段当中，引用关系不会发生变化。在这个区域中的任意地方开始GC都是安全的，我们也可以把安全区域看成是被扩展了的安全点。

在线程执行到Safe Region中的代码时，首先标识自己进入了Safe Region，那样当在这段时间里JVM要发起GC时就不用管标识自己为Safe Region状态的线程了。在线程要离开Safe Region时，它要检查系统是否已经完成了根节点枚举（或者是整个GC过程），如果完成了，那线程就继续执行，否则它就必须等待，直到收到可以安全离开Safe Region的信号为止。

总结：考虑到线程“不执行”时GC开始工作的情况，提出了安全区域的概念，在安全区域内，对象引用关系不会发生改变。

线程进入安全区域时首先标识自己进入安全区域，离开时如果已经完成了GC则线程继续执行，否则挂起直到GC Roots枚举完成或者GC工作完成。