JVM的垃圾回收机制及收集器

1 如何确定一个对象是垃圾？

想要进行垃圾回收，得先知道什么样的对象是垃圾

1.1 引用计数法

引用计数法的逻辑是：在堆中存储对象时，在对象头处维护一个counter计数器，如果一个对象增加了一个引用与之相连，则将counter++。如果一个引用关系失效则counter–。如果一个对象的counter变为0，则说明该对象已经被废弃，不处于存活状态。

弊端：容易产生”孤岛“，即如果AB相互持有引用，导致永远不能被回收。

福利福利福利免费领取Java架构技能地图注意了是免费送

、

免费领取要的+V 领取

1.2 可达性分析

通过GC Root的对象，开始向下寻找，看某个对象是否可达。

能作为GC Root：类加载器、Thread、虚拟机栈的本地变量表、static成员、常量引用，本地方法栈的变量等。

如下图所示，通过GC Root为节点，向下查找，当一个对象没有被GC Root的引用链相连时，将被标记为可回收对象。Object5,、6、7虽说互相持有引用，但是到GC Root是不可达的，所以将会被判断为可回收对象。

2 垃圾回收算法

已经能够确定一个对象为垃圾后，接下来将要考虑的就是回收，那么如何回收呢？

2.1 标记-清除(Mark-Sweep)

标记

找出内存中需要回收的对象，并标记出来

清除

清除掉被标记需要回收的对象，释放出对应的内存空间

**缺点：**

标记和清除两个过程都比较耗时，效率不高
会产生大量不连续的内存碎片，空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时，无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作

2.2 复制(Copying)

将内存划分为两块相等的区域，每次只使用其中一块，如下图所示：

当其中一块内存使用完了，就将还存活的对象复制到另外一块上面，然后把已经使用过的内存空间一次清除掉。

** 缺点：**空间利用率降低

2.3 标记-整理(Mark-Compact)

标记过程仍然与"标记-清除"算法一样，但是后续步骤不是直接对可回收对象进行清理，而是让所有存活的对象都向一端移动，然后直接清理掉端边界以外的内存

让所有存活的对象都向一端移动，清理掉边界意外的内存。

2.4 分代收集算法

Young区：复制算法(对象在被分配之后，可能生命周期比较短，Young区复制效率比较高)
Old区：标记清除或标记整理(Old区对象存活时间比较长，复制来复制去没必要，不如做个标记再清理)

3 垃圾收集器

如果说收集算法是垃圾回收的方法论，那么垃圾收集器就是对其的落地

3.1 Serial收集器

新生代的收集器，早期JDK版本的新生代收集的唯一选择

它是一种单线程的收集器，另外进行垃圾收集的时候会暂停其他线程。

优点：简单高效，拥有很高的单线程手机效率

缺点：需要暂停其他线程

算法：复制算法

使用范围：新生代

应用：Client模式下的默认新生代收集器

3.2 ParNew收集器

新生代的收集器，可以把它理解为Serial收集器的多线程版本

优点：在多CPU时，比Serial效率高。

缺点：收集过程暂停所有应用程序线程，单CPU时比Serial效率差。

算法：复制算法

适用范围：新生代

应用：运行在Server模式下的虚拟机中首选的新生代收集器

3.3 Parallel Scavenge收集器

Parallel Scavenge收集器是一个新生代收集器，它也是使用复制算法的收集器，又是并行的多线程收集器，看上去和ParNew一样，但是Parallel Scanvenge更关注系统的吞吐量。

吞吐量=运行用户代码的时间/(运行用户代码的时间+垃圾收集时间)

比如虚拟机总共运行了100分钟，垃圾收集时间用了1分钟，吞吐量=(100-1)/100=99%。若吞吐量越大，意味着垃圾收集的时间越短，则用户代码可以充分利用CPU资源，尽快完成程序的运算任务

-XX:MaxGCPauseMillis控制最大的垃圾收集停顿时间，
-XX:GC Time Ratio直接设置吞吐量的大小
复制代码

3.4 Serial Old收集器

Serial Old收集器是Serial收集器的老年代版本，也是一个单线程收集器，不同的是采用"标记-整理算法"，运行过程和Serial收集器一样。

3.5 Parallel Old收集器

Parallel Old收集器是Parallel Scavenge收集器的老年代版本，使用多线程和"标记-整理算法"进行垃圾回收。吞吐量优先。

3.6 CMS收集器

CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。

采用的是"标记-清除算法",整个过程分为4步

初始标记 CMS initial mark 标记GC Roots能关联到的对象 Stop The World--->速度很快
并发标记 CMS concurrent mark 进行GC Roots Tracing
重新标记 CMS remark 修改并发标记因用户程序变动的内容 Stop TheWorld
并发清除 CMS concurrent sweep

由于整个过程中，并发标记和并发清除，收集器线程可以与用户线程一起工作，所以总体上来说，CMS收集器的内存回收过程是与用户线程一起并发地执行的

优点：并发收集、低停顿

缺点：采用标记-清除算法会产生大量空间碎片，并发阶段会降低吞吐量

3.7 G1收集器

并行与并发

分代收集（仍然保留了分代的概念）

空间整合（整体上属于“标记-整理”算法，不会导致空间碎片）

可预测的停顿（比CMS更先进的地方在于能让使用者明确指定一个长度为M毫秒的时间片段内，消耗在垃圾收集上的时间不得超过N毫秒）

使用G1收集器时，Java堆的内存布局与就与其他收集器有很大差别，它将整个Java堆划分为多个大小相等的独立区域（Region），虽然还保留有新生代和老年代的概念，但新生代和老年代不再是物理隔离的了，它们都是一部分Region（不需要连续）的集合。

工作过程（与CMS相似）：

初始标记（Initial Marking）标记一下GC Roots能够关联的对象，并且修改TAMS的值，需要暂停用户线程
并发标记（Concurrent Marking）从GC Roots进行可达性分析，找出存活的对象，与用户线程并发执行
最终标记（Final Marking）修正在并发标记阶段因为用户程序的并发执行导致变动的数据，需暂停用户线程
筛选回收（Live Data Counting and Evacuation）对各个Region的回收价值和成本进行排序，根据用户所期望的GC停顿时间制定回收计划

3.8 分类

串行收集器->Serial和Serial Old

只能有一个垃圾回收线程执行，用户线程暂停。适用于内存比较小的嵌入式设备。

并行收集器[吞吐量优先]->Parallel Scanvenge、Parallel Old

多条垃圾收集线程并行工作，但此时用户线程仍然处于等待状态。适用于科学计算、后台处理等弱交互场景。

并发收集器[停顿时间优先]->CMS、G1

用户线程和垃圾收集线程同时执行(但并不一定是并行的，可能是交替执行的)，垃圾收集线程在执行的时候不会停顿用户线程的运行。适用于相对时间有要求的场景，比如Web 。

3.9 如何选择合适的垃圾收集器

官网

[https://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/collectors.html#sthref28](https://docs.oracle.com/javase/8/docs/technotes/guides/vm/gctuning/collectors.html#sthref28)

优先调整堆的大小让服务器自己来选择
如果内存小于100M，使用串行收集器
如果是单核，并且没有停顿时间要求，使用串行或JVM自己选
如果允许停顿时间超过1秒，选择并行或JVM自己选
如果响应时间最重要，并且不能超过1秒，使用并发收集器

**开启方式：**

（1）串行

-XX：+UseSerialGC

-XX：+UseSerialOldGC

（2）并行(吞吐量优先)：

-XX：+UseParallelGC

-XX：+UseParallelOldGC

（3）并发收集器(响应时间优先)

-XX：+UseConcMarkSweepGC

-XX：+UseG1GC