Java的 class文件结构

Java-class文件结构

一、概述

       我们都知道我们现在写的源代码计算机是不认识的,我们需要根据指定的编译器进行编译-连接-执行,这样才是我们想要的结果,所以计算机只能认识0或者1 ,那么如何与操作系统或者机器指令无关的程序能执行,那么在操作系统以及机器指令之上的那就是虚拟机了,这样我们编写的代码不再是最终形成二进制本地指令代码,而是一种在操作系统和机器指令之上的虚拟机规定的文件格式。这也说明了java是一次编写到处运行的由来,但是并不是到处运行的,运行的前提是虚拟机是否此操作系统支持。那么我们的JVM也要所规定class文件的格式,它不管你是什么语言编写并编译出来的class文件,必须严格符合JVM定义的格式,否则JVM不会进行加载的。也有点像我们做TCP UDP定义的消息格式: (比如:我们定义tcp消息格式为:消息头4个字节+不定长度的消息体) 。

 

        class文件是一组以8位字节为基础单位二进制流,各个数据项严格按照顺序紧凑的排列在class文件中,中间不添加任何空格。这样看起来整个class文件中的所有数据都是运行数据,没有空隙存在。如果遇到占用大于8位字节以上的空间的数据项的时候,会以8位字节为单位高位在前低位在后的顺序排列进行存储。class文件结构采用类似c语言伪结构来存储 这种伪结构有两种数据类型:无符号数和表 ,解析都是根据这两个数据类型来解析的。

二、class 文件魔数和版本号

 

 

 

 

     每个class文件的头都包含有4个字节的魔数 他是唯一作用是为了确定这个文件是否确定被JVM所接受,也就是身份识别的作用。 魔数值为:0XCAFEBABE (四个字节)   紧接着是:第五个和第六个字节为次版本号 第七和第八个字节为主版本号比如: 0XCAFEBABE00000032  次版本为0 主版本号为java1.7 

jdk1.0 从45.0开始的 具体版本号查看文档。

三、常量池

在紧跟着版本号后跟着常量池的入口,常量池的u2类型的数据代表池容量计数值 

0XCAFEBABE 00000032 0017

0017 偏移量不是从0开始的而是从1开始的  0x0017 十进制为23 代表有 22个常量,索引从1~22 第0个做特殊处理。常量池中两类常量:字面量和符号引用

字面量:字符别声明为final的常量值等 。

符号引用:

1、 类或者接口的全限定名

2、 方法的签名

3、 字段的签名

这样虚拟机运行的时候会从常量池中获取对应的符号引用。

我们接着往后继续分析class文件内部结构,常量池中的每一项开始都包含有一个u1的tag + 对应数据项,在常量池中一共包含有11中常量项类型:



 

 我们开始分析常量池中的第一项  tag 一个u1 为0x07 十进制为7 代码类型为7的Class_info 

 

 class_info 项 为:一个u1 的tag + 一个u2的指向第几个常量项

0X0002 指的是第二项, 第二项tag为 0x01 为类型为1的UTF8_INFO utf8_info 类型为

一个u1的tag 一个u2的bytelength  + length 个u1的数据区



 

 往后面常量池数据项的对照着类型表依次分析这样太麻烦了。我们可以通过java 中自带的命令进行分析 在jdk中的bin目录下包含有javap 命令  格式为:javap -verbose xxx.class

 我们首先写个java类进行测试

package clazz;

public class MyClazz {

	private String name;
	private int age;
	
	
	
	
	
	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

	public int getAge() {
		return age;
	}

	public void setAge(int age) {
		this.age = age;
	}

	public void say(String name) {
		
		System.err.println("name");
	}
	
	public String getSay(String name) {
		
		return name;
	}
}

 

执行命令 javap -verbose MyClazz.class 

 

D:\work\ewp\test\bin\clazz>javap -verbose MyClazz.class
Classfile /D:/work/ewp/test/bin/clazz/MyClazz.class
  Last modified 2015-11-24; size 1017 bytes
  MD5 checksum 1899fd38b93905c461f55b955076f985
  Compiled from "MyClazz.java"
public class clazz.MyClazz
  SourceFile: "MyClazz.java"
  minor version: 0
  major version: 51
  flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1 = Class              #2             //  clazz/MyClazz
   #2 = Utf8               clazz/MyClazz
   #3 = Class              #4             //  java/lang/Object
   #4 = Utf8               java/lang/Object
   #5 = Utf8               name
   #6 = Utf8               Ljava/lang/String;
   #7 = Utf8               age
   #8 = Utf8               I
   #9 = Utf8               <init>
  #10 = Utf8               ()V
  #11 = Utf8               Code
  #12 = Methodref          #3.#13         //  java/lang/Object."<init>":()V
  #13 = NameAndType        #9:#10         //  "<init>":()V
  #14 = Utf8               LineNumberTable
  #15 = Utf8               LocalVariableTable
  #16 = Utf8               this
  #17 = Utf8               Lclazz/MyClazz;
  #18 = Utf8               getName
  #19 = Utf8               ()Ljava/lang/String;
  #20 = Fieldref           #1.#21         //  clazz/MyClazz.name:Ljava/lang/String;
  #21 = NameAndType        #5:#6          //  name:Ljava/lang/String;
  #22 = Utf8               setName
  #23 = Utf8               (Ljava/lang/String;)V
  #24 = Utf8               getAge
  #25 = Utf8               ()I
  #26 = Fieldref           #1.#27         //  clazz/MyClazz.age:I
  #27 = NameAndType        #7:#8          //  age:I
  #28 = Utf8               setAge
  #29 = Utf8               (I)V
  #30 = Utf8               say
  #31 = Fieldref           #32.#34        //  java/lang/System.err:Ljava/io/PrintStream
  #32 = Class              #33            //  java/lang/System
  #33 = Utf8               java/lang/System
  #34 = NameAndType        #35:#36        //  err:Ljava/io/PrintStream;
  #35 = Utf8               err
  #36 = Utf8               Ljava/io/PrintStream;
  #37 = String             #5             //  name
  #38 = Methodref          #39.#41        //  java/io/PrintStream.println:(Ljava/lang/S
  #39 = Class              #40            //  java/io/PrintStream
  #40 = Utf8               java/io/PrintStream
  #41 = NameAndType        #42:#23        //  println:(Ljava/lang/String;)V
  #42 = Utf8               println
  #43 = Utf8               getSay
  #44 = Utf8               (Ljava/lang/String;)Ljava/lang/String;
  #45 = Utf8               SourceFile
  #46 = Utf8               MyClazz.java
{
  public clazz.MyClazz();
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: invokespecial #12                 // Method java/lang/Object."<init>":()V
         4: return
      LineNumberTable:
        line 3: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
               0       5     0  this   Lclazz/MyClazz;

  public java.lang.String getName();
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: getfield      #20                 // Field name:Ljava/lang/String;
         4: areturn
      LineNumberTable:
        line 13: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
               0       5     0  this   Lclazz/MyClazz;

  public void setName(java.lang.String);
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=2, args_size=2
         0: aload_0
         1: aload_1
         2: putfield      #20                 // Field name:Ljava/lang/String;
         5: return
      LineNumberTable:
        line 17: 0
        line 18: 5
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
               0       6     0  this   Lclazz/MyClazz;
               0       6     1  name   Ljava/lang/String;

  public int getAge();
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: getfield      #26                 // Field age:I
         4: ireturn
      LineNumberTable:
        line 21: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
               0       5     0  this   Lclazz/MyClazz;

  public void setAge(int);
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=2, args_size=2
         0: aload_0
         1: iload_1
         2: putfield      #26                 // Field age:I
         5: return
      LineNumberTable:
        line 25: 0
        line 26: 5
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
               0       6     0  this   Lclazz/MyClazz;
               0       6     1   age   I

  public void say(java.lang.String);
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=2, args_size=2
         0: getstatic     #31                 // Field java/lang/System.err:Ljava/io/Pr
         3: ldc           #37                 // String name
         5: invokevirtual #38                 // Method java/io/PrintStream.println:(Lj
         8: return
      LineNumberTable:
        line 30: 0
        line 31: 8
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
               0       9     0  this   Lclazz/MyClazz;
               0       9     1  name   Ljava/lang/String;

  public java.lang.String getSay(java.lang.String);
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=2, args_size=2
         0: aload_1
         1: areturn
      LineNumberTable:
        line 35: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
               0       2     0  this   Lclazz/MyClazz;
               0       2     1  name   Ljava/lang/String;
}

D:\work\ewp\test\bin\clazz>

  从结果上看 我们可以看到 46个常量项 与我们在前面算的一个 0X2F 十进制为47  0项不算 1~46 正好

对应。

常量池后面仅接着是访问修饰下面是对应修饰表



 我们的public +jdk1.2之后  0x0020 | 0x001 那结果就是 0x0021 



 和我们用javap 命令查看的一样 

  flags: ACC_PUBLIC, ACC_SUPER

接着修饰后面的是类索引 + 父索引 + 接口集合索引

类索引 this_class 一个u2 指向常量池中class_info项的引用地址

java 是只允许单继承不允许多继承的 一个u2的父类索引 指向常量池中class_info项的引用地址

下面是this_class 和父类索引 指向图



 0x001 指向常量池中第一项  0X003 指向常量池中的第三项 (注意他们都是指向class_info 类型)

接口集合索引是一组u2的集合

在此class中 0X0000 此接口集合索引为0 

跟在后面的是 字段表集合

字段描述包括是类级别还是实例级别、作用域、是否为安全的、是否修饰为static  是否可变等

字段表结构



 

 

比如: private String name,sex; 定义   

attr = 2 



 都是指向常量池中的引用地址

猜你喜欢

转载自qq466862016.iteye.com/blog/2258639