JVM机制-类加载的时机,类加载的过程,双亲委派与破坏双亲委派模型

1. 概述

JVM虚拟机把描述类的数据从Class文件加载到内存，并对数据进行校验、转换解析和初始化，最终形成可以被JVM直接使用的Java类型，这就是JVM的类加载机制。

Java语言里面，类的加载、连接和初始化过程都是在程序运行期间完成的。

2. 类加载的时机

从类被加载进内存开始直到卸载出内存为止，类的生命周期包括装载、验证、准备、解析、初始化、使用和卸载7个过程。

JVM机制-类加载的时机,类加载的过程,双亲委派与破坏双亲委派模型

什么情况下需要开始类加载过程的第一个阶段：加载？这个Java虚拟机规范中并没有进行强制约束，可以交给虚拟机的具体实现来自由把握。
但是，对于初始化阶段，虚拟机规范则是严格规定了有且只有5种情况必须立即对类进行“初始化”(加载、验证、准备则在此之前就已经完成)：

(1) 遇到new，getstatic，putstatic或者invokestatic这4条字节码指令时，如果类没有进行过初始化，则需要先触发器初始化。生成这4条指令的最常见的Java代码场景是：使用new关键字实例化对象的时候，读取或设置一个类的静态变量的时候(被final修饰、已在编译期把结果放入常量池的静态常量字段除外)以及调用一个类的静态方法的时候。

(2) 使用java.lang.reflect包的方法对类进行反射调用的时候，如果类还没有进行初始化，则需要先触发其初始化。

(3) 当初始化一个类的时候，如果发现其父类还没有进行初始化，则需要先触发其父类的初始化。

(4) 当虚拟机启动时，用户需要制定一个要执行的主类(包含main()方法的那个类)，虚拟机会先初始化这个主类。

(5) 当使用JDK1.7的动态语言支持时，如果一个java.lang.invoke.MethodHandle实例最后解析的结果是REF_getStatic，REF_putStatic，REF_invokeStatic的方法句柄，并且这个方法句柄所对应的类没有进行过初始化，则需要先触发其初始化。

以上5种场景的行为称为对一个类进行主动引用。除此之外，所有其他引用类的方式都不会触发初始化，称为被动引用。常见的被动引用的例子包括： (1) 通过子类引用父类的静态变量，不会导致子类初始化。 System.out.println(SubClass.staticValue); (2) 通过数组定义来引用类，不会触发此类的初始化。 SuperClass[] arr = new SuperClass[10]; (3) 静态常量在编译阶段会存入调用类的常量池中，本质上并没有直接引用到定义常量的。 System.out.println(ConstClass.finalStaticValue);

3. 类加载的过程

JVM类加载的全过程包括：加载、验证、准备、解析和初始化。

3.1 加载

在加载阶段，JVM需要完成以下3件事：

通过一个类的全限定名(如：java.lang.String)来获取定义此类的二进制字节流。
将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
在内存中生成一个代表这个类的java.lang.Class的对象实例，作为方法区在这个类的各种数据访问的入口。

3.2 验证

验证是连接阶段的第一步，这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求，并且不会危害虚拟机自身的安全。从整体上看，验证阶段大致上会完成下面4个阶段的检验动作：文件格式验证、元数据验证、字节码验证、符号引用验证。

3.2.1 文件格式验证

第一阶段要验证字节流是否符合Class文件格式的规范，并且能被当前版本的虚拟机处理。

3.2.2 元数据验证

第二阶段是对字节码描述的信息进行语义分析，以保证其描述的信息符合Java语言规范的要求，这个阶段可能包括的验证点如下：

这个类是否有父类（除了java.lang.Object之外，所有的类都应当有父类）。
这个类的父类是否继承了不允许被继承的类（被final修饰的类）。
如果这个类不是抽象类，是否实现了其父类或接口之中要求实现的所有方法。等等

3.2.3 字节码验证

第三阶段是整个验证过程中最复杂的一个阶段，主要目的是通过数据流和控制流分析，确定程序语义是合法的、符合逻辑的。

3.2.4 符号引用验证

最后一个阶段的校验发生在虚拟机将符号引用转化为直接引用的时候，这个转化动作将在连接的第三阶段：解析阶段中发生。符号引用验证可以看做是对类自身以外（常量池中 的各种符号引用）的信息进行匹配性校验。

3.3 准备

准备阶段是正式为类变量(static 成员变量)分配内存并设置类变量初始值（零值）的阶段，这些变量所使用的内存都将在方法区中进行分配。

进行内存分配的仅包括类变量，而不包括实例变量，实例变量将会在对象实例化时随着对象一起分配在堆中。
这里所说的初始值“通常情况”下是数据类型的零值，假设一个类变量的定义为：

public static int value=123;

那么，变量value在准备阶段过后的值为0而不是123。因为这时候尚未开始执行任何java方法，而把value赋值为123的putstatic指令是程序被编译后，存放于类构造器方法()之中，所以把value赋值为123的动作将在初始化阶段才会执行。

“特殊情况”是：当类字段的字段属性是ConstantValue时（比如静态常量），会在准备阶段初始化为指定的值，所以标注为final之后，value的值在准备阶段初始化为123而非0。

public static final intvalue =123;

3.4 解析

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。

符号引用（Symbolic References）：符号引用以一组符号来描述所引用的目标，符号可以是任何形式的字面量，只要使用时能无歧义地定位到目标即可。引用的目标并不一定已经加载到内存中。
直接引用（Direct References）：直接引用可以是直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。如果有了直接引用，那引用的目标必定已经在内存中存在。

3.5 初始化

初始化阶段才真正开始执行类中定义的Java程序代码（或者说是字节码）。

初始化阶段是执行类构造器＜clinit＞()方法的过程。＜clinit＞()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块（static{}块）中的语句合并产生的。编译器收集的顺序是由语句在源文件中出现的顺序所决定的，静态语句块中只能访问到定义在静态语句块之前的变量，定义在它之后的变量，在前面的静态语句块可以赋值，但是不能访问。

    public classTest{
        static { 
            i =0;// 给变量赋值可以正常编译通过System.out.print(i);// 这句编译器会提示“非法向前引用”
        }
        static int i =1;
    }

＜clinit＞()方法与类的构造函数（或者说实例构造器＜init＞()方法）不同，它不需要显式地调用父类构造器，虚拟机会保证在子类的＜clinit＞()方法执行之前，父类的＜clinit＞()方法已经执行完毕。因此在虚拟机中第一个被执行的＜clinit＞()方法的类肯定是java.lang.Object。由于父类的＜clinit＞（）方法先执行，也就意味着父类中定义的静态语句块要优先于子类的变量赋值操作，如下代码中，字段B的值将会是2而不是1。

    static class Parent {
        public static int A = 1;
        static {
            A = 2;
        }    }    static class Sub extends Parent {
        public static int B = A;
    }    public static void main (String[] args){
        System.out.println(Sub.B); // 输出结果是父类中的静态变量A的值,也就是2。
    }

＜clinit＞()方法对于类或接口来说并不是必需的，如果一个类中没有静态语句块，也没有对变量的赋值操作，那么编译器可以不为这个类生成＜clinit＞()方法。
接口中不能使用静态语句块，但仍然有变量初始化的赋值操作，因此接口与类一样都会生成＜clinit＞()方法。但接口与类不同的是，执行接口的＜clinit＞()方法不需要先执行父接口的＜clinit＞()方法。只有当父接口中定义的变量使用时，父接口才会初始化。另外，接口的实现类在初始化时也一样不会执行接口的＜clinit＞()方法。
虚拟机会保证一个类的＜clinit＞()方法在多线程环境中被正确地加锁、同步，如果多个线程同时去初始化一个类，那么只会有一个线程去执行这个类的＜clinit＞()方法，其他线程都需要阻塞等待，直到活动线程执行＜clinit＞()方法完毕。如果在一个类的＜clinit＞()方法中有耗时很长的操作，就可能造成多个进程阻塞[2]，在实际应用中这种阻塞往往是很隐蔽的。

4. 双亲委派模型

4.1 类与类加载器

类加载器：实现类加载阶段的“通过一个类的全限定名来获取描述此类的二进制字节流”的动作的代码模块称为"类加载器"。虚拟机设计团队把这个动作放到Java虚拟机外部去实现，以便让应用程序自己觉得如何去获取所需要的类。
对于任意一个类，都需要由加载它的类加载器和这个类本身一同确立其在Java虚拟机中的唯一性，每一个类加载器，都拥有一个独立的类名称空间。比较两个类是否“相等”，只有在这两个类是由同一个类加载器加载的前提下才有意义，否则，即使这两个类来源于同一个Class文件，被同一个虚拟机加载，只要加载它们的类加载器不同，那这两个类就必定不相等。

4.2 类加载器的种类

从Java虚拟机的角度，只存在两种不同的类加载器：

启动类加载器(Bootstrap ClassLoader)，这个类加载器使用C++语言实现，是虚拟机自身的一部分。
另一种就是所有其他类的加载器，这些类加载器都是由Java语言实现，独立于虚拟机外部，并且全都继承自抽象类java.lang.ClassLoader。

从Java开发人员角度，类加载器还可以分为3种系统提供的类加载器和用户自定义类加载器。

启动类加载器(Bootstrap ClassLoader)：负责加载存放＜JAVA_HOME＞\lib目录中的，或者被-Xbootclasspath参数所指定的路径中的类。
扩展类加载器(Extension ClassLoader): 这个加载器由sun.misc.Launcher$ExtClassLoader实现，它负责加载＜JAVA_HOME＞\lib\ext目录中的，或者被java.ext.dirs系统变量所指定的路径中的所有类库，开发者可以直接使用扩展类加载器。
应用程序类加载器(Application ClassLoader): 这个类加载器由sun.misc.Launcher$App-ClassLoader实现。由于这个类加载器是ClassLoader中的getSystemClassLoader()方法的返回值，所以一般也称它为系统类加载器。它负责加载用户类路径（ClassPath）上所指定的类库，开发者可以直接使用这个类加载器，如果应用程序中没有自定义过自己的类加载器，一般情况下这个就是程序中默认的类加载器。
自定义类加载器(User ClassLoader): 用户自定义的类加载器。用户在编写自己定义的类加载器时，如果需要把加载请求委派给引导类加载器，那直接使用null代替即可。要创建用户自己的类加载器，只需要继承java.lang.ClassLoader类，然后覆盖它的findClass(String name)方法即可，即指明如何获取类的字节码流。

如果要符合双亲委派规范，则重写findClass方法（用户自定义类加载逻辑)。
要破坏的话，重写loadClass方法(双亲委派的具体逻辑实现)。

这些类加载器之间的关系一般如下图所示：

JVM机制-类加载的时机,类加载的过程,双亲委派与破坏双亲委派模型

4.3 双亲委派模型

上图展示的类加载器之间的这种层次关系，称为类加载器的双亲委派模型(Parents Delegation Model)。

双亲委派模型要求除了顶层的启动类加载器外，其余的类加载器都应当有自己的父类加载器。
类加载器的双亲委派模型在JDK 1.2被引入，当它并不是一个强制性的约束模型，而是Java设计者推荐给开发者的一种类加载器的实现方式。

双亲委派模型的工作过程是：

如果一个类加载器收到了类加载的请求，它首先不会自己去尝试加载这个类，而是把这个请求委派给父类加载器去完成。
每一个层次的类加载器都是如此，因此所有的类加载请求最终都是应该传送到顶层的类加载器中。
只有父加载器反馈自己无法完成这个加载请求，子加载器才会尝试自己去加载。

双亲委派模型可以用来解释一个问题：为什么不能自定义java.lang.String类？

回答：通过双亲委派模型我们知道: 如果用户自定义的类加载器收到了加载java.lang.String类的请求并且java.lang.String类还未加载，那么自定义的类加载器会将加载请求委派给父加载器，直到被委派到启动类加载器(Bootstrcp ClassLoader)。可启动类加载器并不认识用户自定义的java.lang.String类，它只会加载JDK中的java.lang.String类。

4.4 破坏双亲委派模型

上文提到过双亲委派模型并不是一个强制性的约束模型，而是Java设计者推荐给开发者的类加载器实现方式。在Java的世界中大部分的类加载器都遵循这个模型，但也有例外，到目前为止，双亲委派模型主要出现过3较大规模的“被破坏”情况。

为了向前兼容，JDK 1.2之后的java.lang.ClassLoader添加了一个新的protected方法findClass()，在此之前，用户去继承java.lang.ClassLoader的唯一目的就是为了重写loadClass()方法，因为虚拟机在进行类加载的时候会调用加载器的私有方法loadClassInternal()，而这个方法的唯一逻辑就是去调用自己的loadClass()。
第二次破坏双亲委派模型是由于这个模型自身的缺陷导致，它无法解决解决基础类又要调用用户代码的问题。

(1)是JNDI服务(Java Naming and Directory Interface)，JNDI的代码由启动类加载器去加载，但JNDI的目的是对资源进行集中管理和查找，它需要调用独立厂商实现并部署在应用程序的ClassPath下的JNDI接口提供者的代码，但是启动类加载器可能不认识这些代码。于是Java设计团队引入了：线程上下文类加载器(Thread Context ClassLoader)。JNDI服务使用这个线程上下文类加载器去加载所需要的SPI代码，也就是父类加载器请求子类加载器去完成类加载的动作，这破坏了双亲委派模型。

(2) 比如tomcat，根据Java Servlet规范，要求Web应用自己的类优先级高于Web容器提供的类。tomcat对于一些未加载的非基础类，各个Web应用自己的类加载器(WebAppClassLoader)会优先加载，加载不到时再交给commonClassLoader走双亲委派模型。

双亲委派模型的第三次“被破坏”是由于用户对程序的动态性的追求导致的。为了实现热插拔，热部署，模块化，意思是添加一个功能或减去一个功能不用重启，只需要把这模块连同类加载器一起换掉就实现了代码的热替换。例如OSGi(Open Service Gateway Initiative)的出现。在OSGi环境下，类加载器不再是双亲委派模型中的树状结构，而是进一步发展为网状结构。