JVM知识扫盲篇

一:故事背景

最近在回顾JVM的基本知识,今天在这里总结一下,JVM的基础知识。方便之后再次进行回顾。

二:知识点主要构成

2.1 JVM为什么能跨平台

  1. JVM类似于软件。不同系统上的JVM是不一样的,但是却提供了相同的功能。
  2. JVM执行的是字节码文件,也就是.java 编译后生成的.class 文件。这样做的好处是可以很好的提高执行效率。
    在这里插入图片描述

2.2 JVM整体结构

jvm整体结构宏观如下,每一部分我都进行了表明,下面将会详细讲解,每一部分的作用。
在这里插入图片描述

2.1 类加载子系统

2.1.1 概述

类加载子系统主要分为三个步骤,分别是 加载、链接、初始化。其中链接最为重要。链接主要分为三个部分,分别是 验证、准备、解析。这里重点解释一下什么叫做:“将符号引用解析为直接引用”。
在Java里,Java类和其成员都表示为 符号引用。不涉及到具体的内存地址或者方法指针。当Java程序在JVM上运行的时候,符号引用要被解析为直接引用,以便在运行的时候可以正确的找到对应的类、方法、字段。
在这里插入图片描述

2.1.2 具体类加载器

Java中提供的类加载器主要分为 2类四种。

  1. 引导类加载器
    引导类加载器(BootStrapClassLoader),一般由C或者C++语言编写,直接与操作系统交互,我们一般不对齐进行操作
  2. 自定义类加载器
    Java提供了2中自定义类加载器,通过实现(ClassLoader类)进行实现,分别是 ExtClassLoader、APPClassLoader、加载器。不同的类加载器负责加载不同的目录。

2.1.3 双亲委派机制

在这里插入图片描述

  1. 作用:避免类重复加载、防止核心API被篡改。
  2. 概述:加载类的时候,先提交给其父类进行类加载。一直提交给 BootStrapClassLoader,如果都无法加载指定类,才由自己进行加载。

2.1.4 Tomcat为什么要自定义类加载器

JVM判断一个类是不是已经加载的逻辑是:类名+对应的类加载器实例
如果Tomcat直接使用APPClassLoader类进行加载类的话,会出现多个项目中同名的类无法进行加载的情况。
例如我们有项目A和项目B,项目A内有一个类其全称为com.test.Hello.class,项目B中同样有一个类为com.test.Hello.class。如果使用同一个APPClassLoader,会导致只能加载一个的情况。Tomcat针对这种情况为每个应用都设置了自己单独的类加载器 WebappClassLoader 这样两个应用中的Hello.class类都会分别进行加载,不会产生冲突。

2.2 运行时数据区

2.2.1 整体概念

在这里插入图片描述

根据上面颜色的不同,将其分成了线程共享和线程隔离的两大部分。其中方法区和堆是多个线程共享的。
方法栈和本地方法栈,程序计数器。都不会被多个线程共享。每个线程独立的进行管理,管理自己的方法的调用过程。

2.2.2 程序计数器的作用

  1. PC Register,程序计数寄存器,建成程序计数器。它是物理寄存器的抽象实现。用来记录待执行的下一条指令的地址。
  2. 其实程序控制流的指示器,循环、if else、异常处理、线程恢复,都依赖其完成。

2.2.3 虚拟机栈(Java栈、Java方法栈)

在这里插入图片描述
java方法执行的过程中,不停的将方法对应的栈帧压入栈中。执行完之后,将会将栈帧进行出栈。

  1. 什么是栈帧:
    2.
  • 局部变量表存储了定义的每个变量。
  • 操作数栈用来记录要进行操作的数。

这里给一个小例子,用来方便理解操作数栈

public static void main(String[] args) {
    
    
	int a = 10;
	int b = 20;
	int c = a+b;
}

在这里插入图片描述
在执行操作的时候,会先将树放到操作数栈内,然后根据不同的指令将操作数放入到局部变量表,不同的变量具体对应的变量内。

2.2.4 本地方法栈

概念:
在Java中定义,但是由其它语言实现的方法。例如:native method方法。

2.2.5 堆以及堆中的各个区域作用

2.2.5.1 概念:
  • JVM规范中规定所有的对象和数组都该存放在堆中,在执行字节码指令时,将创建的对象存入堆中,对象对应的引用地址存入虚拟机栈中的栈帧中。
  • 当方法执行完之后,创建的对象不会马上回收,而是等到jvm后台执行GC后,对象才会被回收。
2.2.5.2 堆内存设置:
  • -Xms:(memory start),用来指定初始化内存的大小。
  • -Xmx:(memory max),指定堆的最大内存大小。
  • 一般会把 -Xms和-Xmx的值设置为一样,这样Jvm在GC之后,就不需要去修改堆内的内存大小了

我们可以自己实践来查看指定的堆的大小
启动jar包:

java -XX:NativeMemoryTracking=summary -Xms1024m -Xmx1024m -jar  jar包路径 

使用jcmd命令查看

//1.jcmd 查看进程号
jcmd 
//2. 根据进程号查看堆的使用情况
jcmd 进程id VM.native_memory summary
2.2.5.3 堆初始化大小:
  • 初始化内存大小:物理内存/64
  • 最大内存大小:物理内存/4
2.2.5.4 新生代与老年代
  • 新生代存放的是刚刚创建的对象
  • 老年代存放的是经过多次GC之后,仍然存在的对象
  • 新生代与老年代默认的比例为 1:2 ,一遍不需要调整,除非明确知道存活时间较久的对象更多,则需要调大老年代占比。
2.2.5.5 对象流转过程

在这里插入图片描述

  • 新生代分为三块区域,分别是 Eden、S0、S1。三块区域,新对象创建出来,会先放到Eden区内,当进行一次Youg GC之后,剩余的对象将会转移到S0,并且增加一个GC次数的表示。在阈值到达之前,都会在S0-S1,反复转移。知道达到GC的阈值,才会进入老年代。
  • 如果创建的大对象,从Eden区域出来之后,无法放入 S0,S1,区域,对象在经历过一次GC之后,将会直接进入老年代。
  • 如果创建的是超大对象,无法放入Eden区的话,创建的对象将会直接存入老年代。

2.3 垃圾回收

2.3.1 概念

垃圾指的是JVM中,没有任何引用指向它的对象。如果不清理这些垃圾对象,那么它们就会一直占用内存,而无法给其他对象使用,最终垃圾对象越来越多,直到OOM。

2.3.2 寻找垃圾对象方法

引用计数法:

  • 每个对象都保存一个引用计数器属性,用户记录对象被引用的次数。
  • 实现起来简单,但是需要额外的空间来存储引用数,维护引用数。并且无法处理循环引用问题。
    可达性分析法:
    从GCRoot开始,寻找到可达对象,不可达的就是失去引用的对象。
    GCRoot:
  • 正在执行的方法的参数、局部变量引用的对象
  • 本地方法栈正在执行的方法的参数、局部变量所对应对象的引用
  • 方法区中保存的类的静态属性对应的对象引用
  • 方法区中保存的类信息中的常量属性对应的对象引用
    在这里插入图片描述

2.3.3 垃圾回收算法

标记-清除算法:

  • 非常基础,常用的垃圾回收算法。分为两个阶段。
  • 标记阶段:从GCRoot 开发遍历,找打可达对象,并且在对象头中标记
  • 清除阶段:堆内存空间进行线性遍历,如果发现对象头中未标记为可达对象,则进行回收
    在这里插入图片描述
  • 存在问题:效率不高,会产生内存碎片问题。由于回收过后,内存是不连续的,新加入的大的对象可能无法存放

复制算法:

  • 将内存空间分为两块,每次使用其中一块,在进行垃圾回收时,将可达对象复制到没有被使用的内存块中,然后再清除当前内存块的对象。后续按照相同的流程进行垃圾回收。
  • 这种算法解决了标记清除算法,存在的碎片问题。
  • 如果可达对象比较多,垃圾对象少,复制算法效率就比较低。其适合新生代的垃圾回收。
  • 始终有一半空间是空闲的。可能需要频繁修改栈内引用指向的堆内对象的地址。
    在这里插入图片描述

标记整理算法:

  • 结合了标记清除和复制算法的优点。首先标记可达对象,将所有存活对象移动到内存的一段,最后清理边界外所有空间。
    在这里插入图片描述

算法对比:

- 标记-清除 标记-整理 复制
速度 中能 最慢 最快
空间开销 少(有碎片) 少(无碎片) 最多
移动对象

2.3.4 常见的垃圾回收器

在这里插入图片描述

三:总结提升

本文总结了Java的JVM虚拟机的整体结构,以及各个结构对应的大概功能,此文章正如标题所说,是属于扫盲篇。希望大家看完之后,能对整个JVM的整个结构,各个结构功能有想应的了解。如果大家感兴趣,还请持续关注我,接下来会更新一些JVM其它相关知识。

猜你喜欢

转载自blog.csdn.net/hlzdbk/article/details/131410535