6、类文件结构（下）

6.4 字节码指令简介

Java虚拟机的指令由一个字节长度的、代表着某种特定操作含义的数字（称为操作
码，Opcode）以及跟随其后的零至多个代表此操作所需参数（称为操作数，Operands）而构
成。由于Java虚拟机采用面向操作数栈而不是寄存器的架构

所以大多数的指令都不包含操作数，只有一个操作码

字节码指令集是一种具有鲜明特点、优劣势都很突出的指令集架构，由于限制了Java虚
拟机操作码的长度为一个字节（即0～255），这意味着指令集的操作码总数不可能超过256条

又由于Class文件格式放弃了编译后代码的操作数长度对齐，这就意味着虚拟机处理那些
超过一个字节数据的时候，不得不在运行时从字节中重建出具体数据的结构，如果要将一个
16位长度的无符号整数使用两个无符号字节存储起来（将它们命名为byte1和byte2），那它
们的值应该是这样的：

这种操作在某种程度上会导致解释执行字节码时损失一些性能。

这样做的优势也非常
明显，放弃了操作数长度对齐，就意味着可以省略很多填充和间隔符号；用一个字节来代
表操作码，也是为了尽可能获得短小精干的编译代码。

这种追求尽可能小数据量、高传输效
率的设计是由Java语言设计之初面向网络、智能家电的技术背景所决定的，并一直沿用至今。

如果不考虑异常处理的话，那么Java虚拟机的解释器可以使用下面这个伪代码当做最基
本的执行模型来理解，这个执行模型虽然很简单，但依然可以有效地工作：

6.4.1、字节码与数据类型

在Java虚拟机的指令集中，大多数的指令都包含了其操作所对应的数据类型信息。例
如，iload指令用于从局部变量表中加载int型的数据到操作数栈中，而fload指令加载的则是
float类型的数据。这两条指令的操作在虚拟机内部可能会是由同一段代码来实现的，但在
Class文件中它们必须拥有各自独立的操作码。

对于大部分与数据类型相关的字节码指令，它们的操作码助记符中都有特殊的字符来表
明专门为哪种数据类型服务：i代表对int类型的数据操作，l代表long,s代表short,b代表byte,c代
表char,f代表float,d代表double,a代表reference。也有一些指令的助记符中没有明确地指明操作
类型的字母，如arraylength指令，它没有代表数据类型的特殊字符，但操作数永远只能是一
个数组类型的对象。还有另外一些指令，如无条件跳转指令goto则是与数据类型无关的。

由于Java虚拟机的操作码长度只有一个字节，所以包含了数据类型的操作码就为指令集
的设计带来了很大的压力：如果每一种与数据类型相关的指令都支持Java虚拟机所有运行时
数据类型的话，那指令的数量恐怕就会超出一个字节所能表示的数量范围了。因此，Java虚
拟机的指令集对于特定的操作只提供了有限的类型相关指令去支持它，换句话说，指令集将
会故意被设计成非完全独立的（Java虚拟机规范中把这种特性称为“Not Orthogonal”，即并非
每种数据类型和每一种操作都有对应的指令）。有一些单独的指令可以在必要的时候用来将
一些不支持的类型转换为可被支持的类型。

Java虚拟机指令集所支持的数据类型：

通过使用数据类型列
所代表的特殊字符替换opcode列的指令模板中的T，就可以得到一个具体的字节码指令。如
果在表中指令模板与数据类型两列共同确定的格为空，则说明虚拟机不支持对这种数据类型
执行这项操作。例如，load指令有操作int类型的iload，但是没有操作byte类型的同类指令

大部分的指令都没有支持整数类型byte、char和short，甚至没有任何指令支持boolean类型。

编译器会在编译期或运行期将byte和short类型的数据带符号
扩展（Sign-Extend）为相应的int类型数据，将boolean和char类型数据零位扩展（ZeroExtend）

为相应的int类型数据。与之类似，在处理boolean、byte、short和char类型的数组时，
也会转换为使用对应的int类型的字节码指令来处理。

大多数对于boolean、byte、short
和char类型数据的操作，实际上都是使用相应的int类型作为运算类型（Computational Type）。

6.4.2、加载和存储指令

加载和存储指令用于将数据在栈帧中的局部变量表和操作数栈之间来回传输

这类指令包括如下内容：

1、将一个局部变量加载到操作栈：iload、iload_＜n＞、lload、lload_＜n＞、fload、fload_

＜n＞、dload、dload_＜n＞、aload、aload_＜n＞。

2、将一个数值从操作数栈存储到局部变量表：istore、istore_＜n＞、lstore、lstore_＜n＞、
fstore、fstore_＜n＞、dstore、dstore_＜n＞、astore、astore_＜n＞。

3、将一个常量加载到操作数栈：bipush、sipush、ldc、ldc_w、ldc2_w、aconst_null、
　　iconst_m1、iconst_＜i＞、lconst_＜l＞、fconst_＜f＞、dconst_＜d＞。

4、扩充局部变量表的访问索引的指令：wide。

存储数据的操作数栈和局部变量表主要就是由加载和存储指令进行操作，除此之外，还
有少量指令，如访问对象的字段或数组元素的指令也会向操作数栈传输数据。

有一部分是以尖括号结尾的（例如iload_＜n＞），这些指
令助记符实际上是代表了一组指令（例如iload_＜n＞，它代表了iload_0、iload_1、iload_2和
iload_3这几条指令）。

这几组指令都是某个带有一个操作数的通用指令（例如iload）的特殊
形式，对于这若干组特殊指令来说，它们省略掉了显式的操作数，不需要进行取操作数的动
作，实际上操作数就隐含在指令中。

除了这点之外，它们的语义与原生的通用指令完全一致

6.43、运算指令

运算或算术指令用于对两个操作数栈上的值进行某种特定运算，并把结果重新存入到操作栈顶。

大体上算术指令可以分为两种：对整型数据进行运算的指令与对浮点型数据进行运算的指令

无论是哪种算术指令，都使用Java虚拟机的数据类型，由于没有直接支持byte、
short、char和boolean类型的算术指令，对于这类数据的运算，应使用操作int类型的指令代替

指令如下：

加法指令：iadd、ladd、fadd、dadd
减法指令：isub、lsub、fsub、dsub
乘法指令：imul、lmul、fmul、dmul
除法指令：idiv、ldiv、fdiv、ddiv
求余指令：irem、lrem、frem、drem
取反指令：ineg、lneg、fneg、dneg
位移指令：ishl、ishr、iushr、lshl、lshr、lushr
按位或指令：ior、lor
按位与指令：iand、land
按位异或指令：ixor、lxo
局部变量自增指令：iinc
比较指令：dcmpg、dcmpl、fcmpg、fcmpl、lcmp

数据运算可能会导致溢
出，例如两个很大的正整数相加，结果可能会是一个负数，这种数学上不可能出现的溢出现
象，对于程序员来说是很容易理解的，但其实Java虚拟机规范没有明确定义过整型数据溢出
的具体运算结果，仅规定了在处理整型数据时，只有除法指令（idiv和ldiv）以及求余指令
（irem和lrem）中当出现除数为零时会导致虚拟机抛出ArithmeticException异常，其余任何整
型数运算场景都不应该抛出运行时异常。

Java虚拟机规范要求虚拟机实现在处理浮点数时，必须严格遵循IEEE 754规范中所规定
的行为和限制。也就是说，Java虚拟机必须完全支持IEEE 754中定义的非正规浮点数值
（Denormalized Floating-Point Numbers）和逐级下溢（Gradual Underflow）的运算规则。这些
特征将会使某些数值算法处理起来变得相对容易一些。

Java虚拟机要求在进行浮点数运算时，所有的运算结果都必须舍入到适当的精度，非精
确的结果必须舍入为可被表示的最接近的精确值，如果有两种可表示的形式与该值一样接
近，将优先选择最低有效位为零的。这种舍入模式也是IEEE 754规范中的默认舍入模式，称
为向最接近数舍入模式。

在把浮点数转换为整数时，Java虚拟机使用IEEE 754标准中的向零舍入模式，这种模式
的舍入结果会导致数字被截断，所有小数部分的有效字节都会被丢弃掉。向零舍入模式将在
目标数值类型中选择一个最接近但是不大于原值的数字来作为最精确的舍入结果。

Java虚拟机在处理浮点数运算时，不会抛出任何运行时异常（这里所讲的是Java
语言中的异常，请读者勿与IEEE 754规范中的浮点异常互相混淆，IEEE 754的浮点异常是一
种运算信号），当一个操作产生溢出时，将会使用有符号的无穷大来表示，如果某个操作结
果没有明确的数学定义的话，将会使用NaN值来表示。所有使用NaN值作为操作数的算术操
作，结果都会返回NaN

在对long类型数值进行比较时，虚拟机采用带符号的比较方式，而对浮点数值进行比较
时（dcmpg、dcmpl、fcmpg、fcmpl），虚拟机会采用IEEE 754规范所定义的无信号比较
（Nonsignaling Comparisons）方式。

6.4.4、类型转换指令

类型转换指令可以将两种不同的数值类型进行相互转换，这些转换操作一般用于实现用
户代码中的显式类型转换操作，或者用来处理本节开篇所提到的字节码指令集中数据类型相
关指令无法与数据类型一一对应的问题。

Java虚拟机直接支持（即转换时无需显式的转换指令）以下数值类型的宽化类型转换
（Widening Numeric Conversions，即小范围类型向大范围类型的安全转换）：

int类型到long、float或者double类型
long类型到float、double类型
float类型到double类型

处理窄化类型转换（Narrowing Numeric Conversions）时，必须显式地使用转换
指令来完成，这些转换指令包括：i2b、i2c、i2s、l2i、f2i、f2l、d2i、d2l和d2f。窄化类型转
换可能会导致转换结果产生不同的正负号、不同的数量级的情况，转换过程很可能会导致数
值的精度丢失

在将int或long类型窄化转换为整数类型T的时候，转换过程仅仅是简单地丢弃除最低位N
个字节以外的内容，N是类型T的数据类型长度，这将可能导致转换结果与输入值有不同的
正负号。这点很容易理解，因为原来符号位处于数值的最高位，高位被丢弃之后，转换结果
的符号就取决于低N个字节的首位了。

在将一个浮点值窄化转换为整数类型T（T限于int或long类型之一）的时候，将遵循以下
转换规则：

1、如果浮点值是NaN，那转换结果就是int或long类型的0。

2、如果浮点值不是无穷大的话，浮点值使用IEEE 754的向零舍入模式取整，获得整数值
v，如果v在目标类型T（int或long）的表示范围之内，那转换结果就是v。

3、否则，将根据v的符号，转换为T所能表示的最大或者最小正数。

从double类型到float类型的窄化转换过程与IEEE 754中定义的一致，通过IEEE 754向最接
近数舍入模式舍入得到一个可以使用float类型表示的数字。如果转换结果的绝对值太小而无
法使用float来表示的话，将返回float类型的正负零。如果转换结果的绝对值太大而无法使用
float来表示的话，将返回float类型的正负无穷大，对于double类型的NaN值将按规定转换为
float类型的NaN值。

尽管数据类型窄化转换可能会发生上限溢出、下限溢出和精度丢失等情况，但是Java虚
拟机规范中明确规定数值类型的窄化转换指令永远不可能导致虚拟机抛出运行时异常。

6.4.5、对象创建与访问指令

虽然类实例和数组都是对象，但Java虚拟机对类实例和数组的创建与操作使用了不同的
字节码指令。

对象创建后，就可
以通过对象访问指令获取对象实例或者数组实例中的字段或者数组元素，这些指令如下

1、创建类实例的指令：new。
2、创建数组的指令：newarray、anewarray、multianewarray。
3、访问类字段（static字段，或者称为类变量）和实例字段（非static字段，或者称为实例变
　　量）的指令：getfield、putfield、getstatic、putstatic。
4、把一个数组元素加载到操作数栈的指令：baload、caload、saload、iaload、laload、
　　faload、daload、aaload。
5、将一个操作数栈的值存储到数组元素中的指令：bastore、castore、sastore、iastore、
　　fastore、dastore、aastore。
6、取数组长度的指令：arraylength。
7、检查类实例类型的指令：instanceof、checkcast

6.4.6、操作数栈管理指令

如同操作一个普通数据结构中的堆栈那样，Java虚拟机提供了一些用于直接操作操作数
栈的指令，包括：
1、将操作数栈的栈顶一个或两个元素出栈：pop、pop2。
2、复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶：dup、dup2、
　　dup_x1、dup2_x1、dup_x2、dup2_x2。
3、将栈最顶端的两个数值互换：swap

6.4.7、控制转移指令

控制转移指令可以让Java虚拟机有条件或无条件地从指定的位置指令而不是控制转移指
令的下一条指令继续执行程序，从概念模型上理解，可以认为控制转移指令就是在有条件或
无条件地修改PC寄存器的值。

控制指令：

1、条件分支：ifeq、iflt、ifle、ifne、ifgt、ifge、ifnull、ifnonnull、if_icmpeq、if_icmpne、
2、if_icmplt、if_icmpgt、if_icmple、if_icmpge、if_acmpeq和if_acmpne。
　　复合条件分支：tableswitch、lookupswitch。
3、无条件分支：goto、goto_w、jsr、jsr_w、ret。

在Java虚拟机中有专门的指令集用来处理int和reference类型的条件分支比较操作，为了
可以无须明显标识一个实体值是否null，也有专门的指令用来检测null值。

对于boolean类型、byte类型、char类型和short类型的条
件分支比较操作，都是使用int类型的比较指令来完成，而对于long类型、float类型和double类
型的条件分支比较操作，则会先执行相应类型的比较运算指令（dcmpg、dcmpl、fcmpg、
fcmpl、lcmp）

运算指令会返回一个整型值到操作数栈中，随后再执行int类型的
条件分支比较操作来完成整个分支跳转。由于各种类型的比较最终都会转化为int类型的比较
操作，int类型比较是否方便完善就显得尤为重要，所以Java虚拟机提供的int类型的条件分支
指令是最为丰富和强大的。

6.4.8、方法调用和返回栈

方法调用（分派、执行过程）将在第8章具体讲解，这里仅列举以下5条用于方法调用的指令

invokevirtual指令用于调用对象的实例方法，根据对象的实际类型进行分派（虚方法分
派），这也是Java语言中最常见的方法分派方式。

invokeinterface指令用于调用接口方法，它会在运行时搜索一个实现了这个接口方法的对
象，找出适合的方法进行调用

invokespecial指令用于调用一些需要特殊处理的实例方法，包括实例初始化方法、私有
方法和父类方法。

invokestatic指令用于调用类方法（static方法）

invokedynamic指令用于在运行时动态解析出调用点限定符所引用的方法，并执行该方
法，前面4条调用指令的分派逻辑都固化在Java虚拟机内部，而invokedynamic指令的分派逻
辑是由用户所设定的引导方法决定的。

方法调用指令与数据类型无关，而方法返回指令是根据返回值的类型区分的，包括
ireturn（当返回值是boolean、byte、char、short和int类型时使用）、lreturn、freturn、dreturn和
areturn，另外还有一条return指令供声明为void的方法、实例初始化方法以及类和接口的类初
始化方法使用。