HotSpot对象创建的奥秘

一 对象创建过程

    在Java程序运行中无时无刻都有对象被创建出来,在Java语言层面,仅仅是一个new关键字而已。

而当虚拟机遇到一条new指令时,会进行一序列对象创建的操作:

1、检查常量池中是否有即将要创建的这个对象所属类的符号引用。

1)如果常量池中没有这个类的符号引用,说明这个类没有被定义,则抛出ClassNotFoundException异常;

2)如果有这个类的符号引用,则进行下步处理;

2、检查这个符号引用所代表的类是否已经被JVM加载。

1)如果该类还没有被加载,就找到该类的class文件,并加载进方法区;

2)如果该类已经被JVM加载,则准备为对象分配内存;

3、根据方法区中该类的信息确定该类所需的内存大小。

    对象所需内存大小在类加载完成后便可以完全确定,为对象分配空间的任务等同于把一块确定

大小的内存从Java堆中划分出来。

4、从堆中划分一块对应大小的内存空间给新的对象。

分配堆中内存有两种算法方式:

1)指针碰撞

    如果JVM垃圾收集器采用复制算法或标记-整理算法等带整理功能的收集器,则Java堆中的内存是绝对规整的,

用过的内存放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,那所需要分配的内存

就仅仅是把指示器指针向空闲空间那边挪动一段与对象大小相等的距离,这种分配方式称为"指针碰撞"(Bump the Pointer)。

2)空闲列表

    如果JVM的垃圾收集器采用标记-清除算法,Java中内存不是规整的,已使用内存和未使用内存相互交错,

就没法通过简单的指针碰撞来为对象分配内存,虚拟机针对这种交错的内存维护了一个列表,记录哪些内存块

是可用的,在分配的时候找到一块足够大的空间划分给对象实例,并更新列表上的记录,

这种分配方式成为"空闲列表"(Free List)。


    总之选择哪种对象内存分配算法是由JVM的垃圾回收算法决定的。除了划分内存外,还有一个问题,

虚拟机创建对象非常频繁,即使仅仅是修改一个指针所指向的位置,在并发情况下也并不是线程安全的,

可能出现正在给对象A分配内存,指针还没来得及修改,对象B又同时使用了原来的指针分配内存的情况。

有两种方案解决这个问题:

1)对分配内存空间的动作做同步处理(虚拟机采用CAS算法配上失败重试的方式保证更新操作的原子性);

2)把内存分配的动作按照线程划分在不同的空间中进行,即每个线程在Java堆中预先分配一小块内存,

称为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB)。哪个线程要分配内存,

就在哪个线程的TLAB上分配,只有TLAB用完,分配新的TLAB的时候才需要同步锁定。

虚拟机是否使用TLAB,可以通过-XX:+/-UseTLAB参数来设定。

5、内存分配完成后,虚拟机需要为对象中的成员变量赋上初始值(默认初始化)。

这么做是为了保证对象的实例字段在Java代码中可以不赋初始值就直接使用。

6、设置对象头中的信息。

    虚拟机需要对对象进行必要的设置,比如这个对象是哪个类的实例、如何才能找到类的元数据信息、

对象的哈希码、对象的GC分代年龄等等。这些信息存放在对象的对象头(Object Header)中。

根据虚拟机运行状态不同,对象头也会有不同的设置。


    在上面工作完事以后,从虚拟机角度看对象已经产生了,但是从Java程序看,对象创建才刚刚开始<init>方法还没执行,

所有的字段都还为零。所以,一般来说(由字节码中是否跟随invokeSpecial指令所决定),

执行new命令后会接着执行<init>方法,把对象按照Java程序进行初始化,这样,真正可用的对象才算完全产生出来。

总结:

符号引用检查-->JVM类加载-->对象空间大小确定-->分配内存给新对象

-->对象赋初始值-->对象头信息设置-->最终初始化为真正可用对象。

二 对象内存模型

在HotSpot虚拟机中,对象在内存中存储的布局可以分为3块区域:

.对象头(Object Header)

.实例数据(Instance Data)

.对齐填充(Padding)

1、对象头

    对象头包含两部分信息,第一部分用于存储对象运行时数据,如哈希码(HashCode)、GC分代年龄、

锁状态标识、线程持有的锁、偏向线程ID、偏向时间戳等等。

    对象头的另一部分存储的是类型指针,即对象指向它的类元数据的指针,虚拟机通过这个指针来

确定这个对象是哪个类的实例。如果对象是一个数组,那么对象头中还要包含数组长度。

2、实例数据

实例数据部分就是成员变量的值,其中包含父类的成员变量和本类的成员变量。

3、对齐填充

    对齐填充并不是必然存在的,也没有特别的含义,仅仅起着占位符的作用。HotSpot要求对象的

总长度必须是8字节的整数倍。由于对象头一定是8字节的整数倍,但实例数据部分的长度是任意的,

因此需要对齐补充字段确保整个对象的总长度为8的整数倍。

三 访问对象过程

我们知道,引用类型的变量中存放的是一个地址,那么根据地址类型的不同,对象有不同的访问方式:

1、句柄访问方式 

    堆中需要有一块叫做“句柄池”的内存空间,用于存放所有对象的地址和所有对象所属类的类信息。 

引用类型的变量存放的是该对象在句柄池中的地址。访问对象时,首先需要通过引用类型的变量找到该对象的句柄,

然后根据句柄中对象的地址再访问对象。如图所示:


2、直接指针访问方式 

    如果使用直接指针访问,那么Java堆对象的布局中就必须考虑如何放置访问类型数据相关信息,

而reference中存储的直接就是对象地址,从而不需要句柄池,通过引用能够直接访问对象。 

但对象所在的内存空间中需要额外的策略存储对象所属的类信息的地址。如图所示:


    这两种访问方式各有优势,使用句柄访问的最大好处就是reference中存储的是稳定的句柄地址,

在对象移动时只会改变句柄中的实例数据指针,而虚拟机栈局部变量表里面的reference引用不需要改变。

    使用直接指针访问方式的最大好处就是速度更快,它节省了一次指针定位的时间开销,由于对象的访问

在Java中非常频繁,因此此类开销累计执行成本也不低。HotSpot使用第二种方式进行对象访问,

某些语言或框架使用句柄访问对象的也不少。

参考书籍:

1、Java虚拟机(第二版)(美)Bill Venners;

2、深入理解Java虚拟机 (第二版) 周志明 著;

3、揭秘Java虚拟机 封压飞 著;


猜你喜欢

转载自blog.csdn.net/yhl_jxy/article/details/80893288