文章目录
一、JVM概述
JVM是Java Virtual Machine(Java虚拟机)的缩写,JVM是一种用于计算设备的规范,它是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。
JVM 是 Java 能够跨平台的核心,用于运行 Java 编译后的二进制字节码,最后生成机器指令,其底层源码是由C++编写而成。
三类JVM:
●**Sun公司HotSpot** Java Hotspot™ 64-Bit Server VM (build 25.181-b13,mixed mode) ( 我们学习基本都是: Hotspot)
●BEA JRockit
●IBM J9VM
二、JVM的位置
2.1 JDK,JRE,JVM三者关系
JDK :(Java Development Kit),Java 开发工具包。JDK 是整个 Java 开发的核心,集成了 JRE 和javac.exe,java.exe,jar.exe 等工具。
JRE :(Java Runtime Environment),Java 运行时环境。主要包含两个部分,JVM 的标准实现和 Java 的一些基本类库。它相对于 JVM 来说,多出来的是一部分的 Java 类库。
2.2 JVM所在位置
JVM 上承开发语言,下接操作系统,它的中间接口就是字节码。
三、JVM的体系结构
JVM内存结构主要有三大块:堆内存、方法区和栈。堆内存是JVM中最大的一块由新生代和老年代组成,而新生·代内存又被分成三部分,Eden空间、From Survivor空间、To Survivor空间,默认情况下年轻代按照8:1:1的比例来分配;
方法区存储类信息、常量、静态变量等数据,是线程共享的区域,为与Java堆区分,方法区还有一个别名Non-Heap(非堆);栈又分为java虚拟机栈和本地方法栈主要用于方法的执行。
控制参数:
- -Xms设置堆的最小空间大小。
- -Xmx设置堆的最大空间大小。
- -XX:NewSize设置新生代最小空间大小。
- -XX:MaxNewSize设置新生代最大空间大小。
- -XX:PermSize设置永久代最小空间大小。
- -XX:MaxPermSize设置永久代最大空间大小。
- -Xss设置每个线程的堆栈大小。
没有直接设置老年代的参数,但是可以设置堆空间大小和新生代空间大小间接控制老年代的空间。
JVM和系统调用之间的关系:
方法区和堆是所有线程共享的内存区域;而java栈、本地方法栈(Native Method Stack)和程序员计数器是运行是线程私有的内存区域。
百分之99的JVM调优都是在堆中调优,Java栈、本地方法栈、程序计数器是不会有垃圾存在的。
3.1 方法区(Method Area)—线程共享
方法区(Method Area),是线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。Java1.8之前被称为永久代(PermGen),1.8改名为元空间(MetaSpace),后面都以元空间表述,常量池位于方法区中。
对于习惯在HotSpot虚拟机上开发和部署程序的开发者来说,很多人愿意把方法区称为“永久代”(Permanent Generation),本质上两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择把GC分代收集扩展至方法区,或者说使用元空间来实现方法区而已。
这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载,一般来说这个区域的回收量较少,但是这部分区域的回收确实是有必要的。
根据Java虚拟机规范的规定,当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。
运行时常量池:存放编译产生的字面量(常量final)和符号引用。包括类和接口的全限定名、字段的名称和描述符以及方法的名称和描述符。Java语言并不要求常量一定只有编译期才能产生,运行期间也能将新的常量放入池中,运行时常量池相对于Class文件常量池的一个重要特征是具备动态性。
方法的执行都是伴随着线程的。原始类型的本地变量以及引用都存放在线程栈中。而引用关联的对象比如String,都存在在堆中。
3.2 Java堆(Heap)— 线程共享
Java堆(Java Heap)与方法区一样是是线程共享的内存区域,Java虚拟机所管理的内存最大的一块。在虚拟机启动时创建,此内存区域的唯一目的就是**存放对象实例**,几乎所有的对象实例都在这里分配内存,并不是所有。
Java堆是**垃圾收集器管理的主要区域**,因此很多时候也被称做“GC堆”。如果从内存回收的角度看,由于现在收集器基本都是采用的分代收集算法,所以Java堆中还可以细分为:新生代和老年代;再细致一点的有Eden空间、From Survivor空间、To Survivor空间等。
根据Java虚拟机规范的规定,Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样。在实现时,既可以实现成固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是按照可扩展来实现的(通过-Xmx和-Xms控制)。
如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常。
代码实现对堆空间的大小控制
/**
* @author Fantic
* @create 2021-08-25 19:06
*/
public class OOM {
public static void main(String[] args) {
//返回虚拟机的最大内存
long maxMemory = Runtime.getRuntime().maxMemory();
//返回虚拟机初始化总内存
long totalMemory = Runtime.getRuntime().totalMemory();
System.out.println("maxMemory = " + maxMemory + "字节\t" + ((double)maxMemory/1024/1024) + "Mb");
System.out.println("totalMemory = " + totalMemory + "字节\t" + ((double)totalMemory/1024/1024) + "Mb");
//默认情况下,分配的总内存地电脑内存的1/4,而初始化内存是:1/64
//发生OOM
//1.尝试扩大堆内存结果
//2.分析内存,看下何处有问题(使用专业工具)
//-Xms****m -Xmx****m -XX:+PrintGCDetails
}
}
3.3 程序计数器 – 线程私有
内存空间小,线程私有。字节码解释器工作是就是通过改变这个计数器的值来选取下一条需要执行指令的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖计数器完成。
如果线程正在执行一个 Java 方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是 Native 方法,这个计数器的值则为 (Undefined)。
此内存区域是唯一一个在 Java 虚拟机规范中没有规定任何 OutOfMemoryError 情况的区域。
3.4 Java 虚拟机栈(JVM Stacks)-- 线程私有
与程序计数器一样,Java虚拟机栈(Java Virtual Machine Stacks)也是线程私有 的,生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法被执行的时候都会同时创建一个栈帧(Stack Frame)用于存储局部变量表、操作栈、动态链接、方法出口等信息。每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
局部变量表:
- 放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、
- 对象引用(reference类型,它不等同于对象本身,根据不同的虚拟机实现,它可能是一个指向对象起始地址的引用指针,也可能指向一个代表对象的句柄或者其他与此对象相关的位置)
- returnAddress类型(指向了一条字节码指令的地址)。
其中64位长度的long和double类型的数据会占用2个局部变量空间(Slot),其余的数据类型只占用1个。局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
在Java虚拟机规范中,对这个区域规定了两种异常状况:
- 如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常;
- 如果虚拟机栈可以动态扩展(当前大部分的Java虚拟机都可动态扩展,只不过Java虚拟机规范中也允许固定长度的虚拟机栈),当扩展时无法申请到足够的内存时会抛出OutOfMemoryError异常。
3.5 本地方法栈(Native Method Stacks)-- 线程私有
本地方法栈(Native Method Stacks)与虚拟机栈所发挥的作用是非常相似的,也是线程私有的,其区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则是为虚拟机使用到的Native方法服务。虚拟机规范中对本地方法栈中的方法使用的语言、使用方式与数据结构并没有强制规定,因此具体的虚拟机可以自由实现它。甚至有的虚拟机(譬如Sun HotSpot虚拟机)直接就把本地方法栈和虚拟机栈合二为一。
与虚拟机栈一样,本地方法栈区域也会抛出StackOverflowError和OutOfMemoryError异常。
3.6 JVM内部各区域的存储文件
- 方法区:类信息、常量、静态变量、即时编译器编译后的代码
- 虚拟机栈:Java方法(局部变量表、操作数栈、动态链接、方法出口)
- 本地方法栈:Native方法(C++方法)
- 堆:对象实例和数组
- 程序计数器:虚拟机字节码指令的地址或Undefined
3.7 不同OutOfMemoryErrors情况:
1.虚拟机栈和本地方法栈溢出;
- 线程请求栈深度大于最大深度
StackOverFlowError
,设置-Xss128k,在单线程下,通过不断调用递归方法。 - 新线程拓展栈时无法扩展出现
OutOfMemoryError
错误,不断创建新线程,并让创建的线程不断运行; - -Xss
2.方法区和运行时常量池溢出;
java.lang.OutOfMemoryErro
r后会跟PermGen space
,不断创建新的字符串常量,并添加到list中;-XX:PermSize
和-XX:MaxPermSize
;
3.堆溢出;
java.lang.OutOfMemoryError:Java heap space
,内存泄漏(通过不断创建新对象,并放入list中,保证GCRoots到对象之间路径可达)和内存溢出;- -Xms -Xmx;
4.本机直接内存溢出;
- 在Heap Dump文件中没有明显异常;
- -XX;
OOM情形举例:
1.Exception in thread “main”: java.lang.OutOfMemoryError: Java heap space
原因:对象不能被分配到堆内存中
2.Exception in thread “main”: java.lang.OutOfMemoryError: PermGen space
原因:类或者方法不能被加载到老年代。它可能出现在一个程序加载很多类的时候,比如引用了很多第三方的库;
3.Exception in thread “main”: java.lang.OutOfMemoryError: Requested array size exceeds VM limit
原因:创建的数组大于堆内存的空间
4.Exception in thread “main”: java.lang.OutOfMemoryError: request bytes for . Out of swap space
原因:分配本地分配失败。JNI、本地库或者Java虚拟机都会从本地堆中分配内存空间
5.Exception in thread “main”: java.lang.OutOfMemoryError: (Native method
原因:同样是本地方法内存分配失败,只不过是JNI或者本地方法或者Java虚拟机发现
四、JVM中类的加载机制
4.1 什么是类的加载
类的加载指的是将类的.class文件中的二进制数据读入到内存中,将其放在运行时数据区的方法区内,然后在堆区创建一个 java.lang.Class
对象,用来封装类在方法区内的数据结构。类的加载的最终产品是位于堆区中的 Class
对象, Class
对象封装了类在方法区内的数据结构,并且向Java程序员提供了访问方法区内的数据结构的接口。
类加载器并不需要等到某个类被“首次主动使用”时再加载它,JVM规范允许类加载器在预料某个类将要被使用时就预先加载它,如果在预先加载的过程中遇到了.class文件缺失或存在错误,类加载器必须在程序首次主动使用该类时才报告错误(LinkageError错误)如果这个类一直没有被程序主动使用,那么类加载器就不会报告错误。
加载.class文件的方式:
- 从本地系统中直接加载
- 通过网络下载.class文件
- 从zip,jar等归档文件中加载.class文件
- 从专有数据库中提取.class文件
- 将Java源文件动态编译为.class文件
4.2 类的生命周期(方法区)
其中类加载的过程包括了加载、验证、准备、解析、初始化五个阶段。在这五个阶段中,加载、验证、准备和初始化这四个阶段发生的顺序是确定的,而解析阶段则不一定,它在某些情况下可以在初始化阶段之后开始,这是为了支持Java语言的运行时绑定(也成为动态绑定或晚期绑定)。另外注意这里的几个阶段是按顺序开始,而不是按顺序进行或完成,因为这些阶段通常都是互相交叉地混合进行的,通常在一个阶段执行的过程中调用或激活另一个阶段。
4.2.1 加载
类加载过程的第一个阶段,在加载阶段,虚拟机需要完成以下三件事情:
- 通过一个类的全限定名来获取其定义的二进制字节流。
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
- 在Java堆中生成一个代表这个类的
java.lang.Class
对象,作为对方法区中这些数据的访问入口。
相对于类加载的其他阶段而言,加载阶段(准确地说,是加载阶段获取类的二进制字节流的动作)是可控性最强的阶段,因为开发人员既可以使用系统提供的类加载器来完成加载,也可以自定义自己的类加载器来完成加载。
加载阶段完成后,虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区之中,而且在Java堆中也创建一个 java.lang.Class
类的对象,这样便可以通过该对象访问方法区中的这些数据。
4.2.2 连接
4.2.2.1 验证:确保被加载的类的正确性
验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。验证阶段大致会完成4个阶段的检验动作:
- 文件格式验证:验证字节流是否符合Class文件格式的规范;例如:是否以
0xCAFEBABE
开头、主次版本号是否在当前虚拟机的处理范围之内、常量池中的常量是否有不被支持的类型。 - 元数据验证:对字节码描述的信息进行语义分析(注意:对比javac编译阶段的语义分析),以保证其描述的信息符合Java语言规范的要求;例如:这个类是否有父类,除了
java.lang.Object
之外。 - 字节码验证:通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的。
- 符号引用验证:确保解析动作能正确执行。
验证阶段是非常重要的,但不是必须的,它对程序运行期没有影响,如果所引用的类经过反复验证,那么可以考虑采用 -Xverifynone
参数来关闭大部分的类验证措施,以缩短虚拟机类加载的时间。
4.2.2.2 准备:为类的静态变量分配内存,并将其初始化为默认值
准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些内存都将在方法区中分配。对于该阶段有以下几点需要注意:
- 这时候进行内存分配的仅包括类变量(static),而不包括实例变量,实例变量会在对象实例化时随着对象一块分配在Java堆中。
- 这里所设置的初始值通常情况下是数据类型默认的零值(如0、0L、null、false等),而不是被在Java代码中被显式地赋予的值。
- 如果类字段的字段属性表中存在
ConstantValue
属性,即同时被final和static修饰,那么在准备阶段变量value就会被初始化为ConstValue属性所指定的值(static final常量在编译期就将其结果放入了调用它的类的常量池中)。
数据类型 | 初始化值 | 数据类型 | 初始化值 | 数据类型 | 初始化值 |
---|---|---|---|---|---|
int | 0 | char | ‘/u0000’ | float | 0.0f |
long | 0L | byte | (byte)0 | double | 0.0d |
short | (short)0 | boolean | false | reference | null |
注意:
1.对基本数据类型来说,对于类变量(static)和全局变量,如果不显式地对其赋值而直接使用,则系统会为其赋予默认的初始化值,而对于局部变量,在使用前必须显式地为其赋值,否则编译时不通过。
2.对于同时被static和final修饰的常量,必须在声明的时候就为其显式地赋值,否则编译时不通过;而只被final修饰的常量则既可以在声明时显式地为其赋值,也可以在类初始化时显式地为其赋值,总之,在使用前必须为其显式地赋值,系统不会为其赋予默认初始化值。
3.对于引用数据类型reference来说,如数组引用、对象引用等,如果没有对其进行显式地赋值而直接使用,系统都会为其赋予默认的初始化值,即null。
4.如果在数组初始化时没有对数组中的各元素赋值,那么其中的元素将根据对应的数据类型而被赋予默认的初始化值。
4.2.2.3 解析:把类中的符号引用转换为直接引用
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程,解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行。符号引用就是一组符号来描述目标,可以是任何字面量。
直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。
4.2.3 初始化(加载、验证、准备自然需要在此之前完成)
初始化为类的静态变量赋予正确的初始值,JVM负责对类进行初始化,主要对类变量进行初始化。在Java中对类变量进行初始值设定有两种方式:
- 声明类变量是指定初始值;
- 使用静态代码块为类变量指定初始值;
JVM初始化步骤:
- 假如这个类还没有被加载和连接,则程序先加载并连接该类;
- 假如该类的直接父类还没有被初始化,则先初始化其直接父类;
- 假如类中有初始化语句,则系统依次执行这些初始化语句;
类初始化时机:只有当对类的主动使用的时候才会导致类的初始化。
类的主动使用情形:
- 创建类的实例,也就是new的方式;
- 访问某个类或接口的静态变量,或者对该静态变量赋值;
- 调用类的静态方法;
- 反射(如
Class.forName(“com.shengsiyuan.Test”)
); - 初始化某个类的子类,则其父类也会被初始化;
- Java虚拟机启动时被标明为启动类的类(
JavaTest
),直接使用java.exe
命令来运行某个主类;
4.2.4 结束生命周期
Java虚拟机结束类的生命周期情形:
- 执行了
System.exit()
方法; - 程序正常执行结束;
- 程序在执行过程中遇到了异常或错误而异常终止;
- 由于操作系统出现错误而导致Java虚拟机进程终止;
4.3 类加载器
4.3.1 类加载器的层次关系
注意:这里父类加载器并不是通过继承关系来实现的,而是采用组合实现的。
4.3.2 类加载器的划分
- 启动类加载器:
BootstrapClassLoader
,负责加载存放在JDK\jre\lib
(JDK代表JDK的安装目录,下同)下,或被-Xbootclasspath
参数指定的路径中的,并且能被虚拟机识别的类库。启动类加载器是无法被Java程序直接引用的。 - 扩展类加载器:
ExtensionClassLoader
,该加载器由sun.misc.Launcher$ExtClassLoader
实现,它负责加载JDK\jre\lib\ext
目录中,或者由java.ext.dirs
系统变量指定的路径中的所有类库(如javax.开头的类),开发者=可以直接使用扩展类加载器。 - 应用程序类加载器:
ApplicationClassLoade
,该类加载器由sun.misc.Launcher$AppClassLoader
来实现,它负责加载用户类路径(ClassPath)所指定的类,开发者可以直接使用该类加载器,如果应用程序中没有自定义过自己的类加载器,一般情况下这个就是程序中默认的类加载器。
/**
* @author Fantic
* @create 2021-08-31 20:49
*/
public class ClassLoaderTest {
public static void main(String[] args) {
ClassLoader loader = Thread.currentThread().getContextClassLoader();
System.out.println(loader);
System.out.println(loader.getParent());
System.out.println(loader.getParent().getParent());
}
}
/*结果:
jdk.internal.loader.ClassLoaders$AppClassLoader@2437c6dc (ApplicationClassLoader)
jdk.internal.loader.ClassLoaders$PlatformClassLoader@6e8dacdf(ExtensionClassLoader)
null
*/
应用程序都是由这三种类加载器互相配合进行加载的,JVM自带的ClassLoader只懂得从本地文件系统加载标准的java class文件,自定义的类加载器(ClassLoader),可以做到如下几点:
- 在执行非置信代码之前,自动验证数字签名;
- 动态地创建符合用户特定需要的定制化构建类;
- 从特定的场所取得java class,例如数据库中和网络中;
4.3.3 JVM类加载机制
- 全盘负责,当一个类加载器负责加载某个Class时,该Class所依赖的和引用的其他Class也将由该类加载器负责载入,除非显示使用另外一个类加载器来载入;
- 父类委托,先让父类加载器试图加载该类,只有在父类加载器无法加载该类时才尝试从自己的类路径中加载该类;
- 缓存机制,缓存机制将会保证所有加载过的Class都会被缓存,当程序中需要使用某个Class时,类加载器先从缓存区寻找该Class,只有缓存区不存在,系统才会读取该类对应的二进制数据,并将其转换成Class对象,存入缓存区。这就是为什么修改了Class后,必须重启JVM,程序的修改才会生效;
4.4 类的加载
类加载的方式:
- 命令行启动应用时候由JVM初始化加载;
- 通过
Class.forName()
方法动态加载; - 通过
ClassLoader.loadClass()
方法动态加载;
分别切换加载方式,会有不同的输出结果。
/**
* @author Fantic
* @create 2021-08-31 20:56
*/
public class LoaderTest {
public static void main(String[] args) throws ClassNotFoundException{
ClassLoader loader = HelloWorld.class.getClassLoader();
System.out.println(loader);
//使用ClassLoader.loadClass()来加载类,不会执行初始化块
loader.loadClass("Test");
//使用Class.forName()来加载类,默认会执行初始化块
Class.forName("Test");
// 使用Class.forName()来加载类,并指定ClassLoader,初始化时不执行静态块
Class.forName("Test", false, loader);
}
}
class Test {
static {
System.out.println("静态初始化块执行了!");
}
}
/*输出结果:
jdk.internal.loader.ClassLoaders$AppClassLoader@2437c6dc
静态初始化块执行了!
*/
Class.forName()和ClassLoader.loadClass()区别
Class.forName()
:将类的.class文件加载到jvm中之外,还会对类进行解释,执行类中的static块;ClassLoader.loadClass()
:只干一件事情,就是将.class文件加载到jvm中,不会执行static中的内容,只有在new Instance才会去执行static块。Class.forName(name,initialize,loader)
带参函数也可控制是否加载static块。并且只有调用了new Instance()方法采用调用构造函数,创建类的对象 。
4.5 双亲委派模型
工作流程:如果一个类加载器收到了类加载的请求,首先不会自己去尝试加载这个类,而是把请求委托给父加载器去完成,依次向上,因此,所有的类加载请求最终都应该被传递到顶层的启动类加载器中,只有当父加载器在它的搜索范围中没有找到所需的类时,即无法完成该加载,子加载器才会尝试自己去加载该类。
双亲委派机制的运行步骤:
- 当
AppClassLoader
加载一个class时,它首先不会自己去尝试加载这个类,而是把类加载请求委派给父类加载器ExtClassLoader
去完成。 - 当
ExtClassLoader
加载一个class时,它首先也不会自己去尝试加载这个类,而是把类加载请求委派给BootStrapClassLoader
去完成。 - 如果
BootStrapClassLoader
加载失败(例如在$JAVA_HOME/jre/lib
里未查找到该class),会使用ExtClassLoader
来尝试加载; - 若ExtClassLoader也加载失败,则会使用
AppClassLoader
来加载,如果AppClassLoader
也加载失败,则会报出异常ClassNotFoundException
。
双亲委派模型意义:
- 系统类防止字节码文件重复;
- 保证Java程序安全稳定运行;
4.6 自定义类加载器
通常情况下,都是直接使用系统类加载器。但是有的时候也需要自定义类加载器。比如应用是通过网络来传输 Java类的字节码,为保证安全性,这些字节码经过了加密处理,这时系统类加载器就无法对其进行加载,这样则需要自定义类加载器来实现。自定义类加载器一般都是继承自 ClassLoader
类,从上面对 loadClass
方法来分析来看,只需要重写 findClass 方法即可。下面我们通过一个示例来演示自定义类加载器的流程(未经加密):
import java.io.*;
import static java.io.File.separatorChar;
/**
* @author Fantic
* @create 2021-08-31 21:25
*/
public class MyClassLoader extends ClassLoader{
private String root;
protected Class<?> findClass(String name) throws ClassNotFoundException{
byte[] classData = loadClassData(name);
if (classData == null) {
throw new ClassNotFoundException();
} else {
return defineClass(name,classData,0,classData.length);
}
}
private byte[] loadClassData(String className){
String filename = root + separatorChar + className.replace('.', File.separatorChar) + ".class";
try {
InputStream ins = new FileInputStream(filename);
ByteArrayOutputStream baos = new ByteArrayOutputStream();
int bufferSize = 1024;
byte[] buffer = new byte[bufferSize];
int length = 0;
while ((length = ins.read(buffer)) != 1){
baos.write(buffer,0,length);
}
return baos.toByteArray();
} catch (IOException e) {
e.printStackTrace();
}
return null;
}
public String getRoot(){
return root;
}
public void setRoot(String s){
this.root = root;
}
public static void main(String[] args) {
MyClassLoader classLoader = new MyClassLoader();
classLoader.setRoot("E:\\temp");
Class<?> testClass = null;
try{
testClass = classLoader.loadClass("Test");
Object object = testClass.newInstance();
System.out.println(object.getClass().getClassLoader());
} catch (IllegalAccessException e) {
e.printStackTrace();
} catch (InstantiationException e) {
e.printStackTrace();
} catch (ClassNotFoundException e) {
e.printStackTrace();
}
}
}
自定义类加载器的核心在于对字节码文件的获取,如果是加密的字节码则需要在该类中对文件进行解密。自定义类加载器注意事项:
- 这里传递的文件名需要是类的全限定性名称, defineClass 方法是按这种格式进行处理的。
- 最好不要重写loadClass方法,容易破坏双亲委托模式。
- 这类Test 类本身可以被
AppClassLoader
类加载,不能把Test.class
放在类路径下。否则,由于双亲委托机制的存在,会直接导致该类由AppClassLoader
加载,而不会通过我们自定义类加载器来加载。
4.7 对象的创建
对象的创建流程:
- 检查参数是否在常量池中定位到一个类的符号引用;该类是否被加载、解析、初始化过(若没有做进行类加载);
- 若有则分配内存;
- 始化已分配内存为零值(保证类型不赋初值可以使用);
- 上面工作完成后,执行init方法按照程序员意愿初始化对象;
对象的内存布局:
- 对象头:在64位虚拟机下没有开启指针压缩的时候,对象头占用16个字节,开启了指针压缩占用12个字节,如果该对象还是数组元素,那么还需要多占用4个字节,用于存储运行时数据和存储类型指针;
- 实例数据:是对象真正存储的有效信息;
- 对齐填充:起占位符的作用,因为JVM规范要求对象占用的内存大小必须是8的倍数,假设一个对象中只有一个char类型成员变量,在不开启指针压缩的情况下,那么他占用的内存大小就是对象头加实例数据8+8+2=18个字节,但是要求是8的倍数,所以真正占用内存时24个字节,其中包含了6个字节的对齐填充.
4.8 对象的访问定位
使用句柄:堆中有句柄池,存储到实例数据和类型数据的指针;栈中的引用指向对象的句柄地址;
优点:
- reference中地址相对稳定;
- 对象被移动(GC时)时只会改变句柄中的实例数据指针;
直接指针:栈中的引用直接存储对象地址,到方法区中类型数据的指针包含在对象实例数据中;
优点:访问速度快,节省了一次指针定位的开销;
五、GC算法和垃圾收集器
垃圾收集Garbage Collection
通常被称为“GC”,诞生于1960年 MIT 的 Lisp 语言,经过半个多世纪,目前已经十分成熟了。在JVM 中,程序计数器、虚拟机栈、本地方法栈都是随线程而生随线程而灭,栈帧随着方法的进入和退出做入栈和出栈操作,实现了自动的内存清理,因此,我们的内存垃圾回收主要集中于 java 堆和方法区中,在程序运行期间,这部分内存的分配和使用都是动态的.
5.1 对象存活判断
判断对象是否存活一般有两种方式:
- 引用计数:每个对象有一个引用计数属性,新增一个引用时计数加1,引用释放时计数减1,计数为0时可以回收。此方法简单,无法解决对象相互循环引用的问题。
- 可达性分析(Reachability Analysis):从垃圾回收器需要回收的对象(GC Roots)开始向下搜索,搜索所走过的路径称为引用链。当一个对象到GC Roots没有任何引用链相连时,则证明此对象是不可用的。不可达对象。
在Java语言中,GC Roots包括:
- 虚拟机栈中引用的对象;
- 方法区中类静态属性实体引用的对象;
- 方法区中常量引用的对象;
- 本地方法栈中JNI引用的对象;
5.2 垃圾回收过程
5.2.1 堆中垃圾回收过程(GC主要区域)
- 如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那它将会被第一次标记 ;
- 判断对象是否有必要执行finalize()方法,(没有覆盖,被调用过,都没有必要执行),放入F-Queue队列;
- 放入F-Queue中,进行第二次标记;
- 被拯救的移除队列,被两次标记的被回收;
5.2.2 方法区中垃圾回收
(1)废弃常量:没有任何一个对象引用常量池中的“abc”常量;
(2)无用的类(满足条件可以被回收,非必然):
- 该类所有的实例都已经被回收;
- 加载该类的加载器被回收 ;
- 该类对应的
javalang.Class
对象没有在任何地方被引用,无法通过反射访问该类的方法 ;
5.3 垃圾收集算法
5.3.1 标记-清除算法
“标记-清除”(Mark-Sweep)算法分为标记和清除两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收掉所有被标记的对象。它是最基础的收集算法,后续的收集算法都是基于这种思路并对其缺点进行改进而得到的。
主要缺点:
- 效率问题,标记和清除过程的效率都不高;
- 空间问题,标记清除之后会产生大量不连续的内存碎片,连续内存不足会再次触发GC。
5.3.2 复制算法
复制算法,将内存等分,每次用一块,当这块内存用完了,就将活着的对象复制到另一块,然后把前者清空 。
这样使得每次都是对其中的一块进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。只是这种算法的代价是将内存缩小为原来的一半,持续复制长生存期的对象则导致效率降低。
缺点:
- 对象存活率较高时就要进行较多的复制操作,效率将会降低(不适用于老年代) ;
- 空间利用率低;
5.3.3 标记-整理算法
根据老年代的特点,有人提出了另外一种“标记-整理”(Mark-Compact)算法,标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
5.3.4 分代收集算法
GC分代的基本假设:绝大部分对象的生命周期都非常短暂,存活时间短。
“分代收集”(Generational Collection)算法,把Java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都发现有大批对象死去,选用复制算法。而老年代中因为对象存活率高,使用“标记-清理”或“标记-整理”算法来进行回收。
5.3.5 HotSpot算法
枚举根结点:当执行系统停顿下来后,并不需要一个不漏的检查完所在执行上下文和全局的引用位置,在HotSpot的实现中,使用一组称为OopMap的数据结构来存放对象引用 ;
安全点:在这些特定的位置,线程的状态可以被确定;
中断方式:
- 抢占式:GC发生时,首先把所有线程全部中断,如果发现有线程中断的地方不在安全点上,就恢复线程,让它跑在安全点上 ;
- 主动式:设置一个标志,各个线程执行时主动轮询这个标志,发现中断标志为真时就自己中断挂起 ;
安全区域:线程Sleep状态或者Blocked状态的时候,无法响应JVM中断,走到安全的地方,无法进行GC,需要使用安全区域,保证这个区域中的任何地方开始GC都是安全的。
5.4 垃圾收集器
收集算法是内存回收的方法论,垃圾收集器就是内存回收的具体实现。
5.4.1 Serial收集器
特点:
- 新生代收集器;
- 新生代复制算法;
- 单线程收集;
- 进行垃圾收集时,必须暂停所有工作线程,直到完成;
应用场景:
- 是HotSpot在Client模式下默认的新生代收集器;
- 简单高效(与其他收集器的单线程相比)
- 对于限定单个CPU的环境来说,Serial收集器没有线程交互(切换)开销,可以获得最高的单线程收集效率;
参数设置:-XX:+UseSerialGC
添加该参数来显式的使用串行垃圾收集器;
5.4.2 ParNew收集器
特点:
- 新生代收集器;
- 新生代复制算法;
- 新生代并行,老年代串行;
- 除了多线程外,其余的行为、特点和Serial收集器一样;
应用场景:
- Server模式下,ParNew收集器是一个非常重要的收集器;
- 单个CPU环境中,不会比Serail收集器有更好的效果,因为存在线程交互开销;
参数设置:
-XX:+UseConcMarkSweepGC
:指定使用CMS后,会默认使用ParNew作为新生代收集器;
-XX:+UseParNewGC
:强制指定使用ParNew;
-XX:ParallelGCThreads
:指定垃圾收集的线程数量,ParNew默认开启的收集线程与CPU的数量相同;
5.4.3 Parallel Scavenge收集器
特点:
- 新生代收集器;
- 新生代复制算法;
- 多线程收集;
- CMS等收集器的关注点是尽可能地缩短垃圾收集时用户线程的停顿时间;而Parallel Scavenge收集器的更关注系统的吞吐量(Throughput);
应用场景:
- 高吞吐量为目标,即减少垃圾收集时间,让用户代码获得更长的运行时间;
- 当应用程序运行在具有多个CPU上,对暂停时间没有特别高的要求时,即程序主要在后台进行计算,而不需要与用户进行太多交互;
参数设置:
XX:MaxGCPauseMillis
控制最大垃圾收集停顿时间-XX:GCTimeRatio
设置垃圾收集时间占总时间的比率-XX:+UseAdptiveSizePolicy
5.4.4 Serial Old收集器
特点:
- 针对老年代;
- 采用"标记-整理"算法(还有压缩,Mark-Sweep-Compact);
- 单线程收集;
应用场景:
- 主要用于Client模式;
- 在Server模式中:在JDK1.5及之前,与Parallel Scavenge收集器搭配使用(JDK1.6有Parallel Old收集器可搭配),作为CMS收集器的后备预案,在并发收集发生Concurrent Mode Failure时使用;
5.4.5 Parallel Old 收集器
特点:
- 针对老年代
- 采用"标记-整理"算法
- 多线程收集
应用场景:
- JDK1.6及之后用来代替老年代的Serial Old收集器;
- 特别是在Server模式,多CPU的情况下;
- 在注重吞吐量以及CPU资源敏感的场景,就有了Parallel Scavenge加Parallel Old收集器的"给力"应用组合;
参数设置:-XX:+UseParallelOldGC
:指定使用Parallel Old收集器;
5.4.6 CMS收集器
特点:
- 针对老年代
- 基于=="标记-清除"算法==(不进行压缩操作,产生内存碎片);
- 以获取最短回收停顿时间为目标;
- 并发收集、低停顿;
- 需要更多的内存(看后面的缺点);
应用场景:
- 与用户交互较多的场景;
- 希望系统停顿时间最短,注重服务的响应速度;
- 以给用户带来较好的体验;
- 如常见WEB、B/S系统的服务器上的应用;
参数设置:
-XX:+UseConcMarkSweepGC
使用CMS收集器
-XX:+ UseCMSCompactAtFullCollection
Full GC后,进行一次碎片整理;整理过程是独占的,会引起停顿时间变长
-XX:+CMSFullGCsBeforeCompaction
设置进行几次Full GC后,进行一次碎片整理
-XX:ParallelCMSThreads
设定CMS的线程数量(一般情况约等于可用CPU数量)
运行过程:
- 初始标记(CMS initial mark);
- 并发标记(CMS concurrent mark);
- 重新标记(CMS remark);
- 并发清除(CMS concurrent sweep);
优点:并发收集、低停顿;
缺点:
- 对CPU资源非常敏感;
- 无法处理浮动垃圾,可能出现"Concurrent Mode Failure"失败;
- 产生大量内存碎片、并发阶段会降低吞吐量;
5.4.7 G1收集器(重要)
特点:
- 并行与并发:GC收集线程并行,用户线程与GC线程并发;
- 分代收集,收集范围包括新生代和老年代;
- 空间整合:结合多种垃圾收集算法,空间整合,不产生碎片;
- 可预测的停顿:低停顿的同时实现高吞吐量;
应用场景:
- 面向服务端应用,针对具有大内存、多处理器的机器;
- 最主要的应用是为需要低GC延迟,并具有大堆的应用程序提供解决方案;
运行过程(不计Remembered Set操作):
- 初始标记:需要停顿用户线程,标记GC Root能直接关联到的对象;
- 并发标记:并发执行,对堆中对象可达性分析;
- 最终标记:需要停顿线程,修正并发标记中因用户线程运行发生改变的标记记录;
- 筛选回收:可以并发,对Region的回收价值和成本排序,根据参数指定回收计划;
参数设置:
-XX:+UseG1GC
:指定使用G1收集器;-XX:InitiatingHeapOccupancyPercent
:当整个Java堆的占用率达到参数值时,开始并发标记阶段;默认为45;-XX:MaxGCPauseMillis
:为G1设置暂停时间目标,默认值为200毫秒;-XX:G1HeapRegionSize
:设置每个Region大小,范围1MB到32MB;目标是在最小Java堆时可以拥有约2048个Region
5.5 常用的收集器组合
新生代GC策略 | 老年代GC策 略 | 说明 | |
---|---|---|---|
组合1 | Serial | Serial Old | Serial和Serial Old都是单线程进行GC,特点就是GC时暂停所有应用线程。 |
组合2 | Serial | CMS+Serial Old | CMS(Concurrent Mark Sweep)是并发GC,实现GC线程和应用线程并发工作,不需要暂停所有应用线程。另外,当CMS进行GC失败时,会自动使用Serial Old策略进行GC。 |
组合3 | ParNew | CMS | 使用 -XX:+UseParNewGC 选项来开启。ParNew是Serial的并行版本,可以指定GC线程数,默认GC线程数为CPU的数量。可以使用-XX:ParallelGCThreads选项指定GC的线程数。如果指定了选项 -XX:+UseConcMarkSweepGC 选项,则新生代默认使用ParNew GC策略。 |
组合4 | ParNew | Serial Old | 使用 -XX:+UseParNewGC 选项来开启。新生代使用ParNew GC策略,年老代默认使用Serial Old GC策略。 |
组合5 | Parallel Scavenge | Serial Old | Parallel Scavenge策略主要是关注一个可控的吞吐量:应用程序运行时间 / (应用程序运行时间 + GC时间),可见这会使得CPU的利用率尽可能的高,适用于后台持久运行的应用程序,而不适用于交互较多的应用程序。 |
组合6 | Parallel Scavenge | Parallel Old | Parallel Old是Serial Old的并行版本 |
组合7 | G1GC | G1GC | -XX:+UnlockExperimentalVMOptions -XX:+UseG1GC #开启; -XX:MaxGCPauseMillis=50 #暂停时间目标; -XX:GCPauseIntervalMillis=200 #暂停间隔目标; -XX:+G1YoungGenSize=512m #年轻代大小; -XX:SurvivorRatio=6 #幸存区比例 |
5.6 内存分配和回收策略
- 对象优先在Eden分配:大多数情况下,对象在新生代Eden区中分配,当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC;
- 大对象直接进入老年代:所谓大对象,就是需要大量连续内存空间的对象,最典型的大对象就是那种很长的字符串以及数组;
- 长期存活的对象将进入老年代;
- 动态对象年龄判定:如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可以进入老年代,无须等到
MaxTenuringThreshold
中要求的年龄; - 空间分配担保:Minor GC之前,JVM检查老年代最大连续空间是否大于新生代所有对象的空间,成立则确保Minor GC安全,不成立,参看参数HandlePromotionFailure是否允许担保失败,允许则检查老年代最大连续空间是否大于历次晋升的对象的平均大小,大于则尝试Minor GC,否则,进行Full GC;
六、GC调优命令简述
Sun JDK监控和故障处理命令有jps、jstat、jmap、jhat、jstack、jinfo:
- jps,
JVM Process Status Tool
,显示指定系统内所有的HotSpot虚拟机进程; - jstat,
JVM statistics Monitoring
是用于监视虚拟机运行时状态信息的命令,它可以显示出虚拟机进程中的类装载、内存、垃圾收集、JIT编译等运行数据; - jmap,
JVM Memory Map
命令用于生成heap dump
文件; - jhat,
JVM Heap Analysis Tool
命令是与jmap搭配使用,用来分析jmap生成的dump,jhat内置了一个微型的HTTP/HTML服务器,生成dump的分析结果后,可以在浏览器中查看; - jstack,用于生成java虚拟机当前时刻的线程快照;
- jinfo,
JVM Configuration info
这个命令作用是实时查看和调整虚拟机运行参数;
七、GC调优工具简述
常用调优工具分为两类,jdk自带监控工具:jconsole
和jvisualvm
,第三方有:MAT(Memory Analyzer Tool)
、GChisto
。
- jconsole,
Java Monitoring and Management Console
是从java5开始,在JDK中自带的java监控和管理控制台,用于对JVM中内存,线程和类等的监控; - jvisualvm,jdk自带全能工具,可以分析内存快照、线程快照;监控内存变化、GC变化等;
- MAT,
Memory Analyzer Tool
,一个基于Eclipse的内存分析工具,是一个快速、功能丰富的Java heap分析工具,它可以帮助我们查找内存泄漏和减少内存消耗; - GChisto,一款专业分析gc日志的工具。