从Architecture带你认识JVM

什么是JVM

JVM就是java virtual machine,java虚拟机 image.png

JVM就是将java源文件编译成字节码文件,然后加载到虚拟机,JVM在执行字节码时,最终把字节码解释成具体平台上的机器指令执行。这个就是一次编写,到处运行。 image.png

JVM是一种java虚拟机规范,很多厂商进行了实现,可以通过java -version命令查看

  • Oracle:HotSpot、JRockit
  • IBM:J9 VM
  • Ali:TaobaoVM
  • Zual:Zing

当然最常见的就是HotSpot了 image.png

docs.oracle.com/javase/8/do… ,JVM在这一层,所以平时我们装了jdk,jvm也自带装好了。

image.png

HotSpot JVM架构

下面是hotspot官网上的架构图 image.png

然后我们来依次介绍各个组件

类加载器

类加载器分为三个过程,Loading,Linking,Initializing。

Loading装载

装载就是找到Class文件所在的全路径,然后装载到内存中,生成一个与之匹配的Class对象。JVM在运行的时候会产生三个类加载器,每一个类加载器加载自己所属范围的架包。用户也可以自定义类加载器。

image.png

类加载的时候使用的是双亲委派模式。当加载一个类的时候先检查是否已经装载过了,如果没有的话判断是否存在上层,如果有上层就继续交给上层去装载,直到最顶层。如果找到最顶层都发现没有被装载过,那就自顶向下再加载。

image.png

我们点开ClassLoader.java源码发现也是这么一个过程。 image.png 那么这么做的一个好处就是安全,当我们自己写了一个java.lang.String的类要装载的时候,由于这样的机制,需要交给顶层Bootstrap ClassLoader去装载,当到达顶层的时候发现已经被装载过了,那么就直接返回,那么自己写的java.lang.String类也就不会被装载进去了,具体的思路流程小伙伴可以结合着ClassLoader.java源码再理解下。

小伙伴们再看下demo,加深下印象。 image.png

Linking链接

Linking又分为Verification验证、Preparation准备、Resolution解析三个过程。

验证就是确保Class文件字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身安全。

准备负责为类的类变量(被static修饰的变量)分配内存,并设置默认初始化值。

解析动态地将运行时常量池中的符号引用转变为直接引用。

符号引用长这样:5d85 5849 2f63

直接引用长这样:0x00ab 0x00ba 物理内存地址

Initializing初始化

对类的静态变量,静态代码块执行初始化操作。

运行时数据区

一共有五个区域,方法区,堆,java虚拟机栈,程序计数器,本地方法栈。

Java堆是Java虚拟机所管理内存中最大的一块,在虚拟机启动时创建,被所有线程共享。Java对象实例以及数组都在堆上分配。堆内存空间不足时,就会抛出OOM。

一个Java对象在内存中包括3个部分:对象头、实例数据和对齐填充。Mark Word里面更详细的64位可以查看《大话Synchronized及锁升级》文章。

image.png

当执行下面这句话的时候,静态成员变量存储在方法区,而new Object()对象存储在堆。

private static Object obj = new Object();

image.png

new Object()对象的类信息即类的模板存储在方法区。 image.png

堆分为两大块,一个是old区,一个是young区,young区又分为两大块,一个是Survivor区(S0+S1),一块是Eden区,S0和S1一样大,也可以叫From和To。 image.png

感受OOM:

首先打开jdk安装目录下的bin目录下的jvisualvm.exe文件,以管理员身份运行

image.png

打开以后点击工具—插件

image.png

然后安装一下Visual GC这个插件,重启一下

image.png

启动一个Spring Boot项目,JVM的参数设置成-Xmx50M -Xms50M,这样堆的大小就设置成50M。

image.png image.png

我们看到已经注册上来了 image.png

写一段生成对象的代码

@RestController
public class HeapController {
    List<Worker> list = new ArrayList<Worker>();

    @GetMapping("/heap")
    public String heap() throws Exception {
        while (true) {
//            Thread.sleep(10);
            list.add(new Worker());
        }
    }

}

访问一下,一直在转圈

image.png

我们看到VisualVM里old区已经飙升满了 image.png

编辑器也报出了OOM的错误信息 image.png

感受结束

方法区

方法区是一种规范,真正的实现在JDK 8中就是Metaspace元空间,在JDK6或7中就是Perm Space永久代。 方法区是各个线程共享的内存区域,在虚拟机启动时创建。方法区中存储的是类信息、常量、静态变量、即时编译器编译后的代码等数据。当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常,我们同样来感受一下。

先在项目中引用asm的架包,这个是创建类信息的工具

<dependency>
    <groupId>asm</groupId>
    <artifactId>asm</artifactId>
    <version>3.3.1</version>
</dependency>

然后把方法区的大小也设置成50M image.png

写一个创建类信息的工具类,这个是网上的模板代码

public class MetaspaceUtil extends ClassLoader {

    public static List<Class<?>> createClasses() {
        List<Class<?>> classes = new ArrayList<Class<?>>();
        for (int i = 0; i < 10000000; ++i) {
            ClassWriter cw = new ClassWriter(0);
            cw.visit(Opcodes.V1_1, Opcodes.ACC_PUBLIC, "Class" + i, null,
                    "java/lang/Object", null);
            MethodVisitor mw = cw.visitMethod(Opcodes.ACC_PUBLIC, "<init>",
                    "()V", null, null);
            mw.visitVarInsn(Opcodes.ALOAD, 0);
            mw.visitMethodInsn(Opcodes.INVOKESPECIAL, "java/lang/Object",
                    "<init>", "()V");
            mw.visitInsn(Opcodes.RETURN);
            mw.visitMaxs(1, 1);
            mw.visitEnd();
            MetaspaceUtil test = new MetaspaceUtil();
            byte[] code = cw.toByteArray();
            Class<?> exampleClass = test.defineClass("Class" + i, code, 0, code.length);
            classes.add(exampleClass);
        }
        return classes;
    }
}

启动下项目

image.png

访问下请求非堆的方法

@RestController
public class NonHeapController {

    List<Class<?>> list = new ArrayList<Class<?>>();

    @GetMapping("/nonheap")
    public String heap() {
        while (true) {
            list.addAll(MetaspaceUtil.createClasses());
        }
    }
}

image.png

看下编辑器已经报错了

image.png 感受结束

Java虚拟机栈

Java虚拟机栈是线程独有的,里面保存着一个线程中方法的调用状态,它的生命周期是和线程绑定在一起。每一个被线程执行的方法,为该栈中的栈帧,即每个方法对应一个栈帧,调用一个方法,就会向栈中压入一个栈帧;一个方法调用完成,就会把该栈帧从栈中弹出。

当我们运行如下一段代码的时候,压栈出栈的过程是这样的。

void a(){
   b();
}
void b(){
   c();
}
void c(){
}

image.png 当我们发生递归的时候,不停的往里面压栈,由于栈的大小是固定的,所以超出以后也会发生OOM。感受一下

public class StackOverFlowDemo {

    public static long count = 0;

    public static void method() {
        System.out.println(count++);
        method();
    }

    public static void main(String[] args) {
        method();
    }
}

运行一下,报错了

image.png

我们看下栈帧里面有哪些东西

  • 局部变量表:用来存储局部变量的
  • 操作数栈:为了进行算术运算的一个临时保存地方
  • 动态链接:将符号引用转化为直接引用,上面讲解析的时候会转换一部分,这叫静态解析,还有一部分就是运行期间转换,这叫动态链接
  • 返回地址:GOTO JUMP为了让后续的方法能够顺利执行

image.png

程序计数器

也是线程独有的,如果线程正在执行Java方法,则计数器记录的是正在执行的虚拟机字节码指令的地址。如果正在执行的是Native方法,则这个计数器为空。

本地方法栈

类比java虚拟机栈,我们看下Object类里面的hashCode()方法,这是一个native方法,当调用到java编写的方法的时候可以压入到java虚拟栈,而hashCode是native方法怎么办,则是压入要本地方法栈。

image.png 通过动态链接链接过去 image.png

Execution Engine

我们看到官网上的Execution Engine只有JIT Compiler,这个是编译器,我画的图上会多一个Interpreter,这个是解释器,为什么官网上没画,是因为JDK1.0开始就默认已经有了,而JIT是后面的版本不停的加入的。

image.png

编译器

什么是编译器,编译器是将源代码编译(翻译)成低级语言的程序,这里的javac就是编译器,javac把Helloworld.java文件编译成Helloworld.class文件,交给JVM运行,因为JVM只能认识class字节码文件。同时在不同的操作系统上安装对应版本的JDK,里面包含了各自屏蔽操作系统底层细节的JVM, 这样同一份class文件就能运行在不同的操作系统平台之上,得益于JVM。这也是Write Once,Run Anywhere的原因所在。javac编译器称为前端编译器

解释器

解释器是直接执行用编程语言编写的指令的程序。只有在执行程序时,才一条一条的解释成机器语言给计算机来执行,使用解释器来运行程序会比直接运行编译过的机器码来得慢。Interpreter就是解释Java字节码文件。

执行引擎有三种执行模式。

混合模式

混合模式是JVM的默认工作模式,即JVM同时使用解释模式和编译模式。我们可以敲java -version看下是mixed模式。

image.png

解释器上面已经介绍了,就是把class文件一行一行的解释成机器语言给电脑执行,那么JIT编辑器的作用就是对于字节码中某个方法或代码块执行特频繁时,将其认定为热点代码,然后将热点代码编译成本地代码,并且会进行优化,以此来提高执行效率(这个也是HotSpot的由来)。而被调用很少(甚至只有一次)的方法在解释模式下执行,从而减少编译和优化成本。使用混合模式可以获得最好的执行效率。

JIT编译器称为后端编译器,与javac编译器不同。 因为javac编译的是java文件,JIT编译的是字节码文件。 虚拟机中内置了两个JIT编译器,client compiler(c1)和server compiler(c2),程序会根据虚拟机运行模式(client模式还是server模式)决定使用哪个编译器。

解释模式

  1. 不经过JIT直接由解释器Interpreter解释执行所有字节码。
  2. 特点:启动快(不需要编译),执行慢。
  3. 可通过-Xint参数指定为纯解释模式。

编译模式

  1. 不加筛选的将全部代码编译成机器码,不考虑其执行的频率是否有编译的价值。
  2. 特点:启动慢(编译过程较慢),执行快。
  3. 可通过-Xcomp参数指定为纯编译模式。

Garbage Collector

GC即垃圾收集器,请参考另一篇《一篇文章搞懂GC垃圾回收》 ,整个JVM架构到这里就结束了,喜欢的小伙伴点赞、关注、收藏,一键三连哦~

本文代码在: github.com/xuhaoj/jvm-…

猜你喜欢

转载自juejin.im/post/7124309766427377671