《深入理解Java虚拟机学习笔记之Java内存区域与内存溢出异常》

1.Java虚拟机运行时内存结构

Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途，以及创建和销毁的时间。Java1.7的虚拟机运行时数据区域结构如下图所示：

程序计数器

程序计数器是一块较小的内存空间，它可以看做当前线程所执行的字节码的行号指示器。为了线程切换后能恢复到正确的执行位置，每条线程都需要有一个独立的程序计数器，各条线程之间计数器互不影响，独立存储。如果线程正在执行的是一个Java方法，这个计数器记录的时正在执行的虚拟机字节码指令的地址；如果正在执行的是一个Native方法，这个计数器值则为空(Undefined)。此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryErro情况的区域。

Java虚拟机栈

Java虚拟机栈也是线程私有的，它的生命周期与线程相同。虚拟机栈描述的时Java方法执行的内存模型：每个方法在执行的同时都会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程，就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。

局部变量表存放了编译器可知的各种基本数据类型、对象引用类型(reference类型)和returnAddress类型(指向了一条字节码指令的地址)。其中64位长度的long和double类型的数据会占用2个局部变量空间（slot），其余的数据类型只占用1个。局部变量表所需的内存空间在编译器完成分配，当进入一个方法时，这个方法需要在帧中分配多大的局部变量空间是完全确定的，在方法运行期间不会改变局部变量表的大小。

本地方法栈

本地方法栈与虚拟机栈所发挥的作用非常相似，它们之间的区别不过是虚拟机栈为虚拟机执行Java方法(字节码)服务，而本地方法栈则为虚拟机使用到的Native方法服务。

堆

对于大多数应用来说，Java堆（Java Heap）是Java虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块内存区域，在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例，几乎所有的对象实例都在这里分配内存。

Java堆是垃圾收集器管理的主要区域，因此很多时候也被称作“GC堆”。从内存回收的角度来看，由于现在的垃圾收集器基本都采用分代收集算法，所以Java堆中还可以细分为：新生代和老年代；再细致一点的又Eden空间、Form Survivor空间、To Survivor空间。

根据Java虚拟机规范的规定，Java堆可以处于物理上不连续的内存空间中，只要逻辑上是连续的即可，就像磁盘空间一样。当前主流的虚拟机都是可以扩展堆内存的，通过-Xmx -Xms控制。如果堆中没有内存完成实例分配，并且也无法再扩展时没救会抛出OutOfMemoryError异常。

方法区

方法区（Method Area）与Java堆一样，是各个线程共享的内存区域，它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器变异后的代码等数据。方法区又被称为“永久代”，但并非数据进入方法取就如永久代的名字一样“永久”存在了。这区域的内存回收目标主要是针对常量池的回收和对类型的卸载。当方法区无法满足内存分配需求时，将会抛出OutOfMemoryError异常。

Java1.8后，Oracle完全移除了方法取，取而代之的是元数据区

运行时常量池

运行时常量池是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外，还有一项信息时常量池，用于存放编译器生成的各种字面量和符号引用，这部分内容将在类加载后进入方法区的运行时常量池中存放。

Java1.8后常量池将被存储于堆内存中。

直接内存

直接内存并不是虚拟机运行时数据区的一部分，也不是Java虚拟机规范中定义的内存区域。比如在Java1.4新加入的NIO类，引入了一种基于通道与缓冲区的I/O方式，它可以使用Native函数库直接分配堆外内存，然后通过一个村粗在Java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。直接内存的分配不会受到Java堆大小的限制，但是既然是内存，肯定还是会受到本机总内存大小以及处理器寻址空间的限制。

2.对象的创建

虚拟机遇到一条new指令时，首先将去检查这个指令的参数是否能在常量池定位到一个类的符号引用，并且检查这个符号引用代表的类是否已经被加载、解析和初始化过。如果没有，那么必须先执行相应的类加载过程。然后虚拟机将为新生对象分配内存。对象所需要内存的大小在类加载完成后便可完全确定，为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来。如果堆内存是绝对规整的，即所有用过的内存放一边，没用的放另一边，中间放着一个指针作为分界点的指示器，那么分配内存仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离，这种分配方式为指针碰撞。如果堆内存不是规整的，已使用的内存和未使用的内存相互交错，虚拟机就必须维护一个列表，记录上哪些内存时可用的，在分配的时候就从列表中找到一块足够大的空间划分给对象实例，并更新列表上的记录，这种分配方式称为空间列表。

在分配内存时另一个需要考虑的问题是多线程并发的问题。解决这个问题有两种方案，一种是对分配内存空间的动作进行同步处理；另一种是把内存分配的动作按照线程划分在不同的空间之中进行，即每个线程在Java堆中预先分配一个小块内存，称为本地线程分配缓冲（TLAB）。哪个线程要分配内存，就在该线程的TLAB上分配，只有当TLAB用完并分配新的TLAB时，才需要同步锁定。

内存分配完成后，虚拟机需要将分配到的空间都初始化为零值，这一步操作保证了对象的实例字段在Java代码中可以不赋初始值就能直接使用。接下来，虚拟机要对对象进行必要的设置，例如这个对象时哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。这些信息存放在对象的对象头中。

当上面的工作都完成以后，虚拟机就会执行对象的初始化，这样一个对象才算真正产生出来。

3.对象的内存布局

在HotSpot虚拟机中，对象在内存中存储的布局可以分为3个区域：对象头（Header）、实例数据（Instance Data）和对齐填充（Padding）。

对象头：包括两部分信息，第一部分用于存储对象自身的运行时数据，官方称为“Mark Word”,如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。另一部分是类型指针，即对象指向它的类元数据的指针，虚拟机通过这个指针来确定这个对象时哪个类的实例。并不是所有的虚拟机实现都必须在对象数据上保留类型指针，话句话说，查找对象的元数据信息并不一定一要经过对象本身。

实例数据：对象真正存储的有效信息，也是在程序代码中所定义的各种类型的字段内容。无论是从父类继承下来的，还是在子类中定义的，都需要记录下来。这部分的存储有自己的分配策略：相同宽度的字段总是被分配到一起，父类中定义的变量一定会出现在子类之前。

对齐填充：并不是必然存在的，也没有特别的含义，因为HostSpot要求对象的大小必须是8字节的整数倍。而对象头部分正好是8自己的倍数，因此当对象实例数据部分没有对齐时，就需要通过对齐填充来补全。

4.对象的访问定位

建立对象是为了使用对象，我们的Java程序需要通过栈上的refrence数据来操作堆上的具体对象。由于refrence类型在Java虚拟机规范中只规定了一个指向对象的引用，并没有定义这个引用应该通过何种方式去定位、访问堆中的对象的具体位置，所以对象访问方式也是取决于虚拟机实现而定的。目前主流的访问方式有使用句柄和直接指针两种。

1）句柄访问：Java堆中将会划分出一块内存来作为句柄池，reference中存储的就是对象的句柄地址，而句柄中包含了对象实例数据与类型数据各自的具体地址信息。

2）如果使用直接指针访问，那么Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息，而reference中存储的直接就是对象地址。

这两种对象访问方式各有优势，使用句柄来访问的最大好处就是reference中存储的是稳定的句柄地址，在对象被移动（垃圾回收是移动是非常普遍的行为）时只会改变句柄中的实例数据指针，而reference本身不需要修改。使用直接指针访问的最大好处就是速度更快，它节省了一次指针定位的时间开销。

《深入理解Java虚拟机学习笔记之Java内存区域与内存溢出异常》

猜你喜欢