介绍几种GC算法的思想及其发展过程:
- 标记-清除
- 复制
- 标记-压缩
- 分代收集算法
GC算法主要是用于堆死亡对象的清理的集中方式,他们各有优缺点,下面我们开始做介绍
标记清除算法
- 原理解析
-最基础的收集算法是“标记-清除”( Mark-Sweep) 算法, 如同它的名字一样, 算法分为“标记”和“清除”两个阶段: 首先标记出所有需要回收的对象, 在标记完成后统一回收所有被标记的对象, 它的标记过程其实在前一篇讲述对象标记判定时已经介绍过了。 - 缺点:
- 效率问题, 标记和清除两个过程的效率都不高;
- 标记清除之后会产生大量不连续的内存碎片, 空间碎片太多可能会导致以后在程序运行过程中需要分配较大对象时, 无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
复制算法
- 原理解析
为了解决效率问题, 一种称为“复制”( Copying) 的收集算法出现了, 它将可用内存按容量划分为大小相等的两块, 每次只使用其中的一块。 当这一块的内存用完了, 就将还存活着的对象复制到另外一块上面, 然后再把已使用过的内存空间一次清理掉。 这样使得每次都是对整个半区进行内存回收, 内存分配时也就不用考虑内存碎片等复杂情况, 只要移动堆顶指针, 按顺序分配内存即可, 实现简单, 运行高效。 只是这种算法的代价是将内存缩小为了原来的一半, 未免太高了一点。
复制算法通过牺牲空间的方法,来提高执行效率。 - 应用
这里有一个重要的概念需要引出,就是基于复制算法的对内存分布。因此需要特别提示
- 思想的提出
现在的商业虚拟机都采用这种收集算法来回收新生代, IBM公司的专门研究表明, 新生代中的对象98%是“朝生夕死”的,
所以并不需要按照1:1的比例来划分内存空间, 而是将内存分为一块较大的Eden空间和两块较小的Survivor空间, 每次使用Eden和其中一Survivor。当回收时, 将Eden和Survivor中还存活着的对象一次性地复制到另外一块Survivor空间上, 最后清理掉Eden和刚才用过的Survivor空间。 - 虚拟机的应用
HotSpot虚拟机默认Eden和Survivor1,Survivor2的大小比例是8:1:1, 也就是每次新生代中可用内存空间为整个新生代容量的90%( 80%+10%) , 只有10%的内存会被“浪费”(最为复制后对象的存储区域)。 - 对象大于10%内存的情况
当然, 98%的对象可回收只是一般场景下的数据, 我们没有办法保证每
次回收都只有不多于10%的对象存活, 当Survivor空间不够用时, 需要依赖其他内存( 这里指老年代) 进行分配担保( Handle Promotion) 。 - 内存的分配担保
内存的分配担保就好比我们去银行借款, 如果我们信誉很好, 在98%的情况下都能按时偿还, 于是银行可能会默认我们下一次也能按时按量地偿还贷款, 只需要有一个担保人能保证如果我不能还款时, 可以从他的账户扣钱, 那银行就认为没有风险了。
内存的分配担保也一样, 如果另外一块Survivor空间没有足够空间存放上一次新生代收集下来的存活对象时,这些对象将直接通过分配担保机制进入老年代。
标记-整理算法
当存活对象较多的时候,复制算法效率较低,因此在老年代这种特殊的区域,我们一般使用的是标记-压缩算法。
- 原理
标记过程
仍然与“标记-清除”算法一样, 但后续步骤不是直接对可回收对象进行清理, 而是让所有存活的对象都向一端移动, 然后直接清理掉端边界以外的内存,如上图显示 。
分代收集算法(分为新生代和老年代)
当前商业虚拟机的垃圾收集都采用“分代收集”( Generational Collection) 算法, 这种算法并没有什么新的思想, 只是根据对象存活周期的不同将内存划分为几块。 一般是把Java堆分为新生代和老年代, 这样就可以根据各个年代的特点采用最适当的收集算法。
在新生代中, 每次垃圾收集时都发现有大批对象死去, 只有少量存活, 那就选用复制算法, 只需要付出少量存活对象的复制成本就可以完成收集。
而老年代中因为对象存活率高、 没有额外空间对它进行分配担保, 就必须使用“标记—清理”或者“标记—整理”算法来进行回收。