从JVM角度来看对象

在Java中要创建一个对象最简单方法就是new,当然大部分情况下我们还是通过spring来管理对象。但对于JVM来说一个对象的创建、存亡可没那么简单了。

对象的创建

虚拟机遇到一条new指令时,首先去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已经被加载、解析和初始化。如果没有,则必须先执行相应的类加载过程。参考:关于类加载机制
在类加载检查通过后,接下来虚拟机将为新生对象分配内存。对象所需内存的大小在类加载完成后就可以完全确定,给对象分配空间的任务就等同于把一块确定大小的内存从Java堆中划分出来。

假设Java堆中内存时绝对规整的,所有用过的内存都放一边,空闲的内存放另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是吧指针像空闲的那边移动一段与对象大小相等的距离,这种分配方式称为“指针碰撞”。

假设Java堆中内存并不规整,已使用的内存和空闲相互交错,指针碰撞肯定不行,虚拟机就必须维护一个列表,记录哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录,这种分配方式称为“空间列表”。选择哪种分配方式有Java堆是否规整决定,而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。因此,在使用Serial、ParNew等带Compact过程的收集器时,系统采用的分配算法是指针碰撞,而使用CMS这种基于标记-清除算法的收集器时,通常采用空闲列表。

当然不管哪种分配方式,在并发情况下是线程不安全的,即使是仅仅修改一个指针所指向的位置,比如对象A分配内存,指针还没来的及修改,对象B又同时使用了原来的指针来分配内存情况。有两种解决方案,一种是对分配内存空间的动作进行同步处理——实际上虚拟机采用CAS配上失败重试的方式保证更新新操作的原子性(这种方法被经常使用比如ConcurrentHashMap);另一种是把内存分配的动作按照线程划分在不同的的空间中进行,即每个线程在Java堆中预先分配一小块内存,称为本地现场分配缓冲(Thread Local Allocation Buffer,TLAB)。哪个线程要分配内存,就在哪个线程的TABLE上分配,只有TABLE用完并分配新的TLAB时,才需要同步锁定。虚拟机是否使用TLAB,可以通过-XX:+/-UseTLAB参数来设定。
内存分配完后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头),如果使用TLAB,这一工作过程也可以提前至TLAB分配时进行。这一步操作保证了对象的实例字段在Java代码中可以不赋初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值。接下来,虚拟机要对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头中。至此从虚拟机的角度来看,一个新的对象已经产生了,但从Java程序的角度来看,对象创建才刚刚开始——方法还没执行,所有的字段都还为零。

对象的访问

我们知道Java程序需要通过站上的reference数据来操作堆上的具体对象(可以参考:Java内存区域详解)。Java虚拟机规范中只规定了一个指向对象的引用,并没有定义这个引用应该通过何种方式去定位访问,所有对象的访问方式是由虚拟机来决定的,目前主流的访问方式有使用句柄直接指针两种。
句柄访问:如果使用句柄访问的话,Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息。如图:
这里写图片描述
直接指针:如果使用直接指针访问,那么Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而reference中存储的直接就是对象地址如图:
这里写图片描述

两种访问方式各有优势,使用句柄访问最大的好处就是reference中存储的是稳定的句柄地址,在对象被移动时只会改变句柄中的实例数据指针,而reference本身不需要修改。
而是用直接指针访问方式的最大好处就是速度更快,它节省了一次指针定位的时间开销,由于对象的访问在Java中非常频繁,因此这类开销积少成多也是非常可观的执行成本。

对象的存亡

在Java中几乎所有的实例对象都存在堆空间,垃圾收集器在对堆进行回收前,第一件事情就是要确定这些对象哪些还存活哪些已经死去(即不可能再被任何途径使用的对象),而判断对象的存亡有两种:引用计数算法和可达性分析算法

引用计数算法
给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;当计数值为0时说明此对象已经不再被使用。引用计数算法的实现简单,判定效率高,有一些大型公司使用此方式如微软。但主流的Java虚拟机没有选用此种方式来管理内存,其中主要的原因是它很难解决对象之间的相互循环引用问题。

public class ReferenceCountingGC {  
    public Object instance = null;  

    private static final int _1MB = 1024 * 1024;  

    /** 
     * 
     */  
    private byte[] bigSize = new byte[2 * _1MB];  

    public static void main(String[] args) {  
        ReferenceCountingGC objA = new ReferenceCountingGC();  
        ReferenceCountingGC objB = new ReferenceCountingGC();  
        objA.instance = objB;  
        objB.instance = objA;  

        objA = null;  
        objB = null;  

        //假设在这行发生了GC,objA和ojbB是否被回收  
        System.gc();  
    }  
}  

可达性分析算法
在主流的商用程序语言的主流实现中,都是通过可达性分析算法来判定对象的存活。这个算法的基本思路是童工一系列称为“GC Roots”的对象作为起始点,从这些节点开始 向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连时,则证明此对象不可用。如图:虽然对象8、9、10、11、12相互有引用但是它们到GC Roots是不可达的,所以被判定为可回收对象。
这里写图片描述

在Java语言中,可作为GC Roots的对象包括下面几种:
虚拟机栈(栈帧中的本地变量表)中引用的对象
方法区中类静态属性引用的对象
方法区中常量引用的对象
本地方方栈中Native方法引用的对象

本文来自《深入理解Java虚拟机》

猜你喜欢

转载自blog.csdn.net/weixin_40096176/article/details/80567469