14、jvm字节码执行引擎

JVM主要包含三大核心部分：运行时数据区，类加载器和执行引擎。

虚拟机是相对物理机概念：

物理机的执行引擎建立在cpu、硬件、指令集、和操作系统上的指令集

虚拟机的执行引擎可以自行编制指令集和引擎结构，并且能够执行物理机不支持的指令集。

javac编译器完成了程序代码经过词法分析、语法分析到抽象语法树、再遍历语法树生成线性的字节码指令流的过程。而字节码文件再经过加载、验证、准备、解析、初始化等阶段才能被使用。字节码执行引擎正是执行了这样的过程：输入的是字节码文件，输出的是执行结果。

运行时栈帧结构：

栈帧（stack frame）是用于支持虚拟机进行方法调用和方法执行时的数据结构，它是虚拟机运行时数据区中的虚拟机栈的栈元素。

一般把动态连接、方法返回值、和其他信息归档为栈帧信息；

栈帧包含了局部变量表、操作数栈、动态连接、方法返回地址和一些额外的附加信息。编译后的class文件，栈帧中需要多大的局部变量表、多深的操作数栈都已经完全确定，并且写入到方法表的Code属性之中，因此一个栈帧需要分配多少内存，不会受到程序运行期变量数据的影响，而仅仅取决于具体的虚拟机实现。每一个方法从调用开始到执行完成的过程，就对应着一个栈帧在虚拟机栈里面从入栈到出栈的过程。

对于执行引擎来讲，活动线程中，只有栈顶的栈帧是有效的，称为当前栈帧(Curren Stack Frame)，这个栈帧所关联的方法称为当前方法(Current Method)。

执行引擎所运行的所有字节码指令都只针对当前栈帧进行操作

1、局部变量表(local variable table)：

用于存放方法参数和方法内部定义的局部变量。

局部变量表的容量以变量槽(variable slot)为最小单位，jvm规范规定slot应该存放一个boolean,byte,short,int,char,float,reference,returnAddress类型的数据，而没有限定slot的分配内存大小，对于64位的数据类型只有double,long两种（reference可能为32位也可能为64位），这两种类型占用两个slot。

虚拟机使用局部变量表完成参数传递，如果是实例方法（非static）局部变量表中第0位索引是方法所属对象实例的引用表示this，方法中可以通过this来访问这个隐含的参数。其余参数则按照参数表的顺序来排列，占用从1开始的局部变量slot，参数表分配完毕之后，再根据方法体内部定义的局部变量顺序和作用域分配其余的slot。

为了尽可能节省栈帧空间，局部变量中的slot可以重用，方法体中定义的变量作用域可能不会整个方法体,如fun(){{int a ；}} ，当字节码pc计数器超过了某个值，这个slot就会交给其他变量使用，但在某些情况下会影响gc收集行为；

main(){
{
byte[] nowa = new bate[10*1024*1024];
}
//int a =0;
System.gc();
}}

如果不执行int a = 0这条语句，slot就没有回收，这个零值很有意义：如果nowa是个大对象/大对象数组，占耗很大的内存而不及时清空将影响jvm整体的运行速度，手动设零值，释放内存；java一本非常著名的书籍《practical java》说到"把不使用的对象应手动赋值为null"；

2、操作栈数

operand stack 也称为操作栈，遵循先入先出(FIFO),同局部变量一样，操作数栈的最大深度在编译时就确定，写入到Code属性的max_stacks数据项中，操作数栈的每一个元素可以使任意的java数据类型，包括long和double型，32位数据类型所占的栈容量为1，64位数据类型所占栈容量为2；

当一个方法开始执行时，这个方法的操作数栈是空的，在方法执行过程中，会有各种字节码指令向操作数栈中写入和提取内容。比如，加法的字节码指令iadd在运行时会将栈顶两个元素(栈帧)相加并出栈，再将结果入栈。

在编译器和校验阶段的保证下，操作数栈中元素的数据类型必须与字节码指令的序列严格匹配；在大多数vm会将连续的2个栈帧做出部分重叠，重叠部分为部分局部变量表,使用时共用一个变量表，无须额外传递参数；

3、动态连接dynamic linking

每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用（方法区），持有这个引用是为了支持方法调用过程中的动态连接。

常量池中的方法符号引用，方法符号在类加载阶段（加载、验证、准备、解析、初始化）或者第一次使用时转化为直接引用，这种转化称为静态解析；若在每次运行时都要转换为直接引用的称为动态连接；

4、方法返回地址

有两种方式退出当前执行的方法：

一是执行引擎遇到任意一个方法返回的字节码指令，这种方法称为正常完成出口。

二是在方法执行过程中遇到无法处理的异常，这种方法称为异常完成出口。

无论哪种方法，方法退出后，都需要返回到调用者的位置，正常退出时，调用者的PC计数器值可以作为返回地址，栈帧会保存这个计数器值，而异常退出时，返回地址要通过异常处理器表来确定。

方法退出的过程实际上是将当前栈帧出战，并恢复上层方法的局部变量表和操作数栈，把返回值传入调用者的操作数栈中，调整pc计数器值、

5、栈帧信息

5.1、方法调用

方法调用不等于方法执行，方法调用阶段(这是阶段)其唯一的任务就是确定要执行的那个具体方法,暂时不会执行运行；一切方法在字节码里都是引用符号，而不是实际方法的入口（直接引用），这个特性给了java强大的扩张能力，如动态代理，但也使java调用过程变得更复杂，在类加载阶段和运行时才能确定直接引用！

5.2、解析(阶段)

所用被调用的方法在字节码文件里都是一个符号引用，在类加载阶段，有的会转化为直接引用，而有的要执行时才转化为直接引用，在加载阶段转化的条件：方法是一个可确定的调用版本，并且这个方法的调用版本是固定的，这个方法会在编译时就确定下了，这类方法的调用称为解析。

JVM提供了4条方法调用的字节码指令：

invokestatic:调用静态方法
invokespecial:调用实例构造器<init>方法，私有方法和父类方法
invokevirtual:调用所有的虚方法
invokeinterface:调用接口方法，会在运行时再确定一个实现此接口的对象。
invokedynamic

解析阶段是将(唯一确定的)方法加载到方法区，并不会执行，能被invokestatic和invokespecial调用的方法，即可在解析阶段加载，他们是唯一确定的,这4类方法称为实方法，其他方法称为虚方法；

编写一个static方法：

public class Demo{
  public static void say(){
     System.out.println("ok");
	 }
public static void main(String... s){
 Demo.say();
}
}
用javap -verbose Demo.class打开
public Demo();
1: invokespecial #1                  // Method java/lang/Object."<init>":()V
public static void say();
0: getstatic     #2                  // Field java/lang/System.out:Ljava/io/PrintStream;
5: invokevirtual #4                  // Method java/io/PrintStream.println:(Ljava/lang/String;)V
public static void main(java.lang.String...);
0: invokestatic  #5                  // Method say:()V

5.3、分派

java的3个基本特征：继承、封装、多态；方法的重载和重写。

1，静态分派(static dispatch)---重载

Parent father = new Son();

Parent被称为静态类型(Static Type)或者叫外观类型(Apparent Type),，Son称为实际类型(Actual Type)。

虚拟机（编译器）重载时通过参数的静态类型作为判断依据。所有依赖静态类型来定位方法执行版本的分派动作，都称为静态分派;

Demo d = new Demo();
d.say(w);
d.say(m);

两次调用d的say方法，编译器重载say方法(第一次叫加载，第二次叫重载)，通过参数的静态类型做出方法重载（方法重载：1.参数类型，2.参数数量），依靠参数来定位方法执行版本的分派动作，都称为静态分派。静态分派的最典型应用就是方法重载。 静态分派发生在编译阶段，静态分派操作不是由虚拟机执行，编译器重载时确定重载版本("最适合的版本")。

void say(Object obj){}
void say(char c){}

比如 say('a');会执行第二个方法而不是第一个，因为在方法重载时编译器确定了第二个方法是最适合的版本，而非第一个say()方法；

当出现编译器无法确定该采用何种版本时将拒绝编译。

2，动态分派()---重写

在运行期间，jvm根据实际类型确定方法执行版本的分派过程称为动态分派。

动态分派实现手段“稳定优化”，在类的方法去中建立一个虚方法表(Vritual Method Table，vtable在invokeinterface执行时用用到接口方法表Interface Method Table，itable),使用虚方法表索引来代替元数据查找以提高性能。虚方法表中存放着各个方法的实际入口地址，如果某个方法在子类中没有被重写，那么子类的虚方法表里的入口和父类虚方法入口地址是相同的，都指向父类的入口地址，如果子类重写了父类方法，子类的方法表中保存重写后的方法入口。

3，单分派和多分派

方法(int x = fun(int a,int b);)的接收方x和方法的参数a,b称为方法的宗量，分派基于宗量的种类，分为单分派和多分派两种；

“java语言是一门静态多分派（方法重载多分派）、动态单分派的语言(方法重写单分派)”；

在两个say()方法中，存在不同的静态类型：Object和Character，这里宗量是2个，故为多分派类型；

方法表一般在准备阶段初始化，在类变量完成初始零值赋值之后，jvm把实方法，虚方法也进行加载，但不执行。

6、动态语言支持---invokedynamic指令

14、jvm字节码执行引擎

猜你喜欢