JVM系列一:基础知识

好久没有系统的学习和整理技术知识了,现在这个年纪和工作年限,哎,需要整理技能和系统的学习了,不然,逆水行舟不进则退。陆续会整理一些技术。
本篇文章,开启JVM系列,主要整理和学习JVM偏高级一些技术点。希望大家一起学习。

JDK介绍

jdk不进行具体说做什么,怎么做,作用是什么了,做java开发自行补脑。
需要jdk,我们需要多看看官网介绍和讲解。
最经典的是jdk1.8版本,我们主要也学习此版本。
官网:https://docs.oracle.com/javase/8/

结构

看官网介绍:
Oracle has two products that implement Java Platform Standard Edition (Java SE) 8: Java SE Development Kit (JDK) 8 and Java SE Runtime Environment (JRE) 8.

JDK 8 is a superset of JRE 8, and contains everything that is in JRE 8, plus tools such as the compilers and debuggers necessary for developing applets and applications. JRE 8 provides the libraries, the Java Virtual Machine (JVM), and other components to run applets and applications written in the Java programming language. Note that the JRE includes components not required by the Java SE specification, including both standard and non-standard Java components.

The following conceptual diagram illustrates the components of Oracle’s Java SE products:
简单来说,包含了jdk和jre/jvm部分,看图说话:
在这里插入图片描述
我们着重要雪定的Java Language,Java Virtual Machine,Tools和一些库。

"类"源码文件

类原文件

我们先写一个类文件:Member.java

class Member {
    
    
    private int id;
    private String name;
    private int age;
    private static String address;
    private final static String hobby = "Java";

    public void say() {
    
    
        System.out.println("Member say...");
    }

    public int calc(int op1, int op2) {
    
    
        return op1 + op2;
    }
}

环境&编译下:
在这里插入图片描述
我们能看到多了一个Member.class文件,当然,jvm识别的也是.class文件。
编译过程:
Member.java -> 词法分析器 -> tokens流 -> 语法分析器 -> 语法树/抽象语法树 -> 语义分析器-> 注解抽象语法树 -> 字节码生成器 -> Person.class文件

class文件分析

Member.class:
cafe babe 0000 0034 0028 0a00 0600 1909
001a 001b 0800 1c0a 001d 001e 0700 1f07
0020 0100 0269 6401 0001 4901 0004 6e61
6d65 0100 124c 6a61 7661 2f6c 616e 672f
5374 7269 6e67 3b01 0003 6167 6501 0007
6164 6472 6573 7301 0005 686f 6262 7901
000d 436f 6e73 7461 6e74 5661 6c75 6508
0021 0100 063c 696e 6974 3e01 0003 2829
5601 0004 436f 6465 0100 0f4c 696e 654e
756d 6265 7254 6162 6c65 0100 0373 6179
0100 0463 616c 6301 0005 2849 4929 4901
000a 536f 7572 6365 4669 6c65 0100 0b4d

文件结构:

ClassFile {
    
    
    u4             magic;
    u2             minor_version;
    u2             major_version;
    u2             constant_pool_count;
    cp_info        constant_pool[constant_pool_count-1];
    u2             access_flags;
    u2             this_class;
    u2             super_class;
    u2             interfaces_count;
    u2             interfaces[interfaces_count];
    u2             fields_count;
    field_info     fields[fields_count];
    u2             methods_count;
    method_info    methods[methods_count];
    u2             attributes_count;
    attribute_info attributes[attributes_count];
}

魔数与class文件版本
常量池
访问标志
类索引、父类索引、接口索引
字段表集合
方法表集合
属性表集合

class文件装载到jvm(类加载)

类加载顺序图

在这里插入图片描述

加载

1、首先通过一个类的全限定名来获取此类的二进制字节流;
2、其次将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构;
3、最后在java堆中生成一个代表这个类的Class对象,作为方法区这些数据的访问入口。总的来说就是查找并加载类的二进制数据。

链接:

1、验证:确保被加载类的正确性;
文件格式验证
元数据验证
字节码验证
符号引用验证
2、准备:为类的静态变量分配内存,并将其初始化为默认值;
3、解析:把类中的符号引用转换为直接引用; (区别见下面)

初始化

为类的静态变量赋予正确的初始值

符号引用和直接引用区别

1.符号引用(Symbolic References):符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能够无歧义的定位到目标即可。例如,在Class文件中它以CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info等类型的常量出现。符号引用与虚拟机的内存布局无关,引用的目标并不一定加载到内存中。在Java中,一个java类将会编译成一个class文件。在编译时,java类并不知道所引用的类的实际地址,因此只能使用符号引用来代替。比如org.simple.People类引用了org.simple.Language类,在编译时People类并不知道Language类的实际内存地址,因此只能使用符号org.simple.Language(假设是这个,当然实际中是由类似于CONSTANT_Class_info的常量来表示的)来表示Language类的地址。各种虚拟机实现的内存布局可能有所不同,但是它们能接受的符号引用都是一致的,因为符号引用的字面量形式明确定义在Java虚拟机规范的Class文件格式中。

2.直接引用:
直接引用可以是
(1)直接指向目标的指针(比如,指向“类型”【Class对象】、类变量、类方法的直接引用可能是指向方法区的指针)
(2)相对偏移量(比如,指向实例变量、实例方法的直接引用都是偏移量)
(3)一个能间接定位到目标的句柄
直接引用是和虚拟机的布局相关的,同一个符号引用在不同的虚拟机实例上翻译出来的直接引用一般不会相同。如果有了直接引用,那引用的目标必定已经被加载入内存中了。

类加载器(ClassLoader)

在装载(Load)阶段,其中第(1)步:通过类的全限定名获取其定义的二进制字节流,需要借助类装载
器完成,顾名思义,就是用来装载Class文件的。
(1)通过一个类的全限定名获取定义此类的二进制字节流

图解

在这里插入图片描述
1)Bootstrap ClassLoader 负责加载JAVA_HOME中 jre/lib/rt.jar 里所有的class或 Xbootclassoath选项指定的jar包。由C++实现,不是ClassLoader子类。
2)Extension ClassLoader 负责加载java平台中扩展功能的一些jar包,包括$JAVA_HOME中 jre/lib/*.jar 或 -Djava.ext.dirs指定目录下的jar包。
3)App ClassLoader 负责加载classpath中指定的jar包及 Djava.class.path 所指定目录下的类和 jar包。
4)Custom ClassLoader 通过java.lang.ClassLoader的子类自定义加载class,属于应用程序根据 自身需要自定义的ClassLoader,如tomcat、jboss都会根据j2ee规范自行实现ClassLoader。

加载原则

检查顺序:
检查某个类是否已经加载:顺序是自底向上,从Custom ClassLoader到BootStrap ClassLoader逐层检
查,只要某个Classloader已加载,就视为已加载此类,保证此类只所有ClassLoader加载一次。
加载顺序:
加载的顺序是自顶向下,也就是由上层来逐层尝试加载此类

双亲委派

定义:如果一个类加载器在接到加载类的请求时,它首先不会自己尝试去加载这个类,而是把
这个请求任务委托给父类加载器去完成,依次递归,如果父类加载器可以完成类加载任务,就
成功返回;只有父类加载器无法完成此加载任务时,才自己去加载。
优势:Java类随着加载它的类加载器一起具备了一种带有优先级的层次关系。比如,Java中的
Object类,它存放在rt.jar之中,无论哪一个类加载器要加载这个类,最终都是委派给处于模型
最顶端的启动类加载器进行加载,因此Object在各种类加载环境中都是同一个类。如果不采用
双亲委派模型,那么由各个类加载器自己取加载的话,那么系统中会存在多种不同的Object
类。
破坏:可以继承ClassLoader类,然后重写其中的loadClass方法,其他方式大家可以自己了解
拓展一下。

运行时数据区

官网概述

https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-2.html#jvms-2.5
在这里插入图片描述

什么时候开始有数据了?

在装载阶段的第(2),(3)步可以发现有运行时数据,堆,方法区等名词
(2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
(3)在Java堆中生成一个代表这个类的java.lang.Class对象,作为对方法区中这些数据的访问入口
说白了就是类文件被类装载器装载进来之后,类中的内容(比如变量,常量,方法,对象等这些数
据得要有个去处,也就是要存储起来,存储的位置肯定是在JVM中有对应的空间)

图解

可以参考官网的解释说明
在这里插入图片描述
接下来我们每个区域根据官网的介绍,我们一起了解下。

方法区(Method Area)

先看一段,官网描述:
在这里插入图片描述

1、方法区是各个线程共享的内存区域,在虚拟机启动时创建。
2、用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
3、虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却又一个别名叫做Non-Heap(非堆),目的是与Java堆区分开来。
4、当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。

OK,那么我们会看class装载第二阶段,将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构,我们可以使用图说明:
在这里插入图片描述
值得注意:
1、方法区在JDK 8中就是Metaspace,在JDK6或7中就是Perm Space
2、Run-Time Constant Pool
Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息就是常量池,用于存放编译时期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。
具体其他,看看自己看看官网描述

堆(Heap)

官网描述
The Java Virtual Machine has a heap that is shared among all Java Virtual Machine threads. The heap is the run-time data area from which memory for all class instances and arrays is allocated. The heap is created on virtual machine start-up.

1、Java堆是Java虚拟机所管理内存中最大的一块,在虚拟机启动时创建,被所有线程共享。
2、Java对象实例以及数组都在堆上分配。

回溯到装载阶段的第3步:在Java堆中生成一个代表这个类的java.lang.Class对象,作为对方法区中这些数据的访问入口

在这里插入图片描述

虚拟机栈(Java Virtual Machine Stacks)

官网部分描述
2.5.2. Java Virtual Machine Stacks
Each Java Virtual Machine thread has a private Java Virtual Machine stack, created at the same time as the thread. A Java Virtual Machine stack stores frames (§2.6). A Java Virtual Machine stack is analogous to the stack of a conventional language such as C: it holds local variables and partial results, and plays a part in method invocation and return. Because the Java Virtual Machine stack is never manipulated directly except to push and pop frames, frames may be heap allocated. The memory for a Java Virtual Machine stack does not need to be contiguous.

翻译一下:
每个Java虚拟机线程都有一个私有Java虚拟机堆栈,与线程同时创建。Java虚拟机堆栈存储帧(§2.6)。Java虚拟机堆栈类似于传统语言(如C)的堆栈:它保存局部变量和部分结果,并在方法调用和返回中发挥作用。因为Java虚拟机堆栈除了push和pop帧之外从不被直接操作,所以帧可以被堆分配。Java虚拟机堆栈的内存不需要是连续的。
分析
1、经过上面的分析,类加载机制的装载过程已经完成,后续的链接,初始化也会相应的生效。
假如目前的阶段是初始化完成了,后续做啥呢?肯定是Use使用咯,不用的话这样折腾来折腾去有什么意义?那怎样才能被使用到?换句话说里面内容怎样才能被执行?比如通过主函数main调用其他方法,这种方式实际上是main线程执行之后调用的方法,即要想使用里面的各种内容,得要以线程为单位,执行相应的方法才行。
那一个线程执行的状态如何维护?一个线程可以执行多少个方法?这样的关系怎么维护呢?

2、虚拟机栈是一个线程执行的区域,保存着一个线程中方法的调用状态。换句话说,一个Java线程的运行状态,由一个虚拟机栈来保存,所以虚拟机栈肯定是线程私有的,独有的,随着线程的创建而创建。
3、每一个被线程执行的方法,为该栈中的栈帧,即每个方法对应一个栈帧。
4、调用一个方法,就会向栈中压入一个栈帧;一个方法调用完成,就会把该栈帧从栈中弹出。

分析图解:
在这里插入图片描述

程序计数器( The pc Register)

官网描述
2.5.1. The pc Register
The Java Virtual Machine can support many threads of execution at once (JLS §17). Each Java Virtual Machine thread has its own pc (program counter) register. At any point, each Java Virtual Machine thread is executing the code of a single method, namely the current method (§2.6) for that thread. If that method is not native, the pc register contains the address of the Java Virtual Machine instruction currently being executed. If the method currently being executed by the thread is native, the value of the Java Virtual Machine’s pc register is undefined. The Java Virtual Machine’s pc register is wide enough to hold a returnAddress or a native pointer on the specific platform.

分析
1、一个JVM进程中有多个线程在执行,而线程中的内容是否能够拥有执行权,是根据CPU调度来的。假如线程A正在执行到某个地方,突然失去了CPU的执行权,切换到线程B了,然后当线程A再获得CPU执行权的时候,怎么能继续执行呢?这就是需要在线程中维护一个变量,记录线程执行到的位置。
2、程序计数器占用的内存空间很小,由于Java虚拟机的多线程是通过线程轮流切换,并分配处理器执行时间的方式来实现的,在任意时刻,一个处理器只会执行一条线程中的指令。因此,为了线程切换后能够恢复到正确的执行位置,每条线程需要有一个独立的程序计数器(线程私有)。
3、如果线程正在执行Java方法,则计数器记录的是正在执行的虚拟机字节码指令的地址;
4、如果正在执行的是Native方法,则这个计数器为空。

本地方法栈( Native Method Stacks)

官网:
An implementation of the Java Virtual Machine may use conventional stacks, colloquially called “C stacks,” to support native methods (methods written in a language other than the Java programming language). Native method stacks may also be used by the implementation of an interpreter for the Java Virtual Machine’s instruction set in a language such as C. Java Virtual Machine implementations that cannot load native methods and that do not themselves rely on conventional stacks need not supply native method stacks. If supplied, native method stacks are typically allocated per thread when each thread is created.

对于一个运行中的Java程序而言,它还可能会用到一些跟本地方法相关的数据区。当某个线程调用一个本地方法时,它就进入了一个全新的并且不再受虚拟机限制的世界。本地方法可以通过本地方法接口来访问虚拟机的运行时数据区,但不止如此,它还可以做任何它想做的事情。
不受虚拟机限制的世界了,可能用传统的“C stacks”。可以暂时不分析它了。

部分说明不够完善,后续再更新。

猜你喜欢

转载自blog.csdn.net/fclwd/article/details/112788139