深入浅出谈Java虚拟机 类加载机制

类加载机制:Java虚拟机将描述类的数据从Class文件加载到内存,并对数据进行校验,转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型。

类加载的时机

加载阶段合适开始,《Java虚拟机规范》并没有强制约束,交由虚拟机自己实现。

而初始化阶段,严格规定有且只有以下六种情况,如果类型没有进行过初始化,必须对类进行初始化:

  • 遇到以下字节码指令:

    • new:实例化对象的时候
    • getstatic和putstatic,读取或设置一个类型的静态字段(被final修饰、已在编译期把结果放入常量池的静态字段除外)。
    • invokestatic:调用一个类型的静态方法的时候。
  • 使用java.lang.reflect包对类型进行反射调用的时候。

  • 当初始化类的时候,发现父类还没有进行初始化,则先初始化父类。

  • 虚拟机启动时,会先初始化用户指定执行的主类,main方法所在类。

  • 当使用JDK 7新加入的动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后的解 析结果为REF_getStaticREF_putStaticREF_invokeStaticREF_newInvokeSpecial四种类型的方法句柄,并且这个方法句柄对应的类没有进行过初始化,则需要先触发其初始化。

  • 当一个接口中定义了JDK 8新加入的默认方法(被default关键字修饰的接口方法)时,如果有 这个接口的实现类发生了初始化,那该接口要在其之前被初始化。

类加载的过程

系统加载Class类型的文件主要是三步:加载,连接,初始化。

连接过程又分为三步:验证,准备,解析。

加载

在加载阶段Java虚拟机需要完成的三件事情:

  1. 通过一个类的全限定名来获取定义此类的二进制字节流。
  2. 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
  3. 在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口。

一个非数组类的加载阶段(加载阶段获取类的二进制字节流的动作)是可控性最强的阶段,这一步我们可以去完成还可以自定义类加载器去控制字节流的获取方式(重写一个类加载器的 loadClass() 方法)。数组类型不通过类加载器创建,它由 Java 虚拟机直接创建。

验证

确保Class文件的字节流中包含的信息符合《Java虚拟机规范》的全部约束要求,保证这些信息被当作代码运行后不会危害虚拟机自身的安全。

  • 文件格式验证:验证字节流是否符合Class文件格式的规范。
    • 是否以0XCAFEBABE开头。
    • 主次版本号是否在当前虚拟机的处理范围之内。
    • 常量池中的常量是否有不被支持的类型。
  • 元数据验证:对字节码描述的信息进行语义分析,以保证其描述的信息符合Java语言规范的要求。
    • 这个类是否有父类。【除Object之外都有父类】
    • 这个类是否被继承了不允许继承的类。【final修饰的类】
  • 字节码验证:最复杂的阶段,通过数据流和控制流分析,确定程序语义是否合法、符合逻辑。
    • 比如说任意时刻操作数栈和指令代码序列都能够配合工作。
  • 符号引用验证:确保解析动作能正确执行。

准备

为类中定义的变量,分配内存设置类变量初始值的阶段。

  • 仅仅进行包括类变量的内存分配【static】,不包括实例变量,实例变量将会在对象实例化时随着对象一起分配在Java堆中。
  • 初始值通常情况下时数据类型的零值(int类型为0,boolean类型为false等),特殊情况如类字段的字段中属性表中存在ConstantValue属性时:public static final int value = 123,在准备阶段就会赋值123。

tips:public static int value = 123;该语句在准备阶段过后为value值为0,给value赋值123的操作在类初始化才进行。

解析

Java虚拟机将常量池内的符号引用替换为直接引用的过程

解析动作主要针对7类符号引用:类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用限定符。

Java 虚拟机为每个类都准备了一张方法表来存放类中所有的方法。当需要调用一个类的方法的时候,只要知道这个方法在方发表中的偏移量就可以直接调用该方法了。通过解析操作符号引用就可以直接转变为目标方法在类中方法表的位置,从而使得方法可以被调用。

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程,也就是得到类或者字段、方法在内存中的指针或者偏移量。

初始化

类加载的最后一个过程,前面的几个阶段中,除了加载阶段用户可以自定义加载器参与控制外,其余动作完全 由JVM主导,直到初始化阶段,JVM才真正开始执行类中编写的Java代码,主导权交由应用程序。

初始化阶段是执行类构造器<clinit>()方法的过程。

<clinit>()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块(static{}块)中的 语句合并产生的,编译器收集的顺序是由语句在源文件中出现的顺序决定的,静态语句块中只能访问 到定义在静态语句块之前的变量,定义在它之后的变量,在前面的静态语句块可以赋值,但是不能访问。

JVM会保证子类的<clinit>()方法执行前,父类的<clinit>()方法也已经执行完毕,因此第一个被执行的<clinit>()方法一定在java.lang.Object中。

Java虚拟机必须保证一个类的<clinit>()方法在多线程环境中被正确地加锁同步,如果多个线程同 时去初始化一个类,那么只会有其中一个线程去执行这个类的<clinit>()方法,其他线程都需要阻塞等 待,直到活动线程执行完毕<clinit>()方法。如果在一个类的<clinit>()方法中有耗时很长的操作,那就 可能造成多个进程阻塞。

且其他线程唤醒之后就不会再进入该方法,从而保证再同一个类加载器之下,一个类型只会被初始化一次。


对于初始化阶段,JDK8之前虚拟机严格规范了有且只有5种情况下,必须对类进行初始化(只有主动去使用类才会初始化类):

  1. 当遇到 new 、 getstatic、putstatic或invokestatic 这4条直接码指令时,比如 new 一个类,读取一个静态字段(未被 final 修饰)、或调用一个类的静态方法时。
    • 当jvm执行new指令时会初始化类。即当程序创建一个类的实例对象。
    • 当jvm执行getstatic指令时会初始化类。即程序访问类的静态变量(不是静态常量,常量会被加载到运行时常量池)。
    • 当jvm执行putstatic指令时会初始化类。即程序给类的静态变量赋值。
    • 当jvm执行invokestatic指令时会初始化类。即程序调用类的静态方法。
  2. 使用 java.lang.reflect 包的方法对类进行反射调用时如Class.forname("..."),newInstance()等等。 ,如果类没初始化,需要触发其初始化。
  3. 初始化一个类,如果其父类还未初始化,则先触发该父类的初始化。
  4. 当虚拟机启动时,用户需要定义一个要执行的主类 (包含 main 方法的那个类),虚拟机会先初始化这个类。
  5. MethodHandle和VarHandle可以看作是轻量级的反射调用机制,而要想使用这2个调用, 就必须先使用findStaticVarHandle来初始化要调用的类。

JDK8新增:

  1. 当一个接口中定义了JDK8新加入的默认方法(被default关键字修饰的接口方法)时,如果有这个接口的实现类发生了初始化,那该接口要在其之前被初始化。

猜你喜欢

转载自blog.csdn.net/zx309519477/article/details/108816601