JVM原理及调优分析

1、JVM是什么?
JVM是Java Virtual Machine(Java虚拟机)的缩写,是JAVA模拟出来的一套虚拟物理机。 JVM是一个标准,一套规范,  规定了.class文件在其内部运行的相关标准和规范。
如下图:

2、JVM的体系结构

2.1 类加载器(Class Loader)
    负责加载 .class文件, class文件在文件开头有特定的文件标示,并且ClassLoader负责class文件的加载等,至于它是否可以运行,则由Execution Engine决定。
     ① 定位和导入二进制class文件
    ② 验证导入类的正确性
    ③ 为类分配初始化内存
    ④ 帮助解析符号引用.
2.2 Native Interface 本地接口:
      本地接口的作用是融合不同的编程语言为Java所用,它的初衷是融合C/C++程序,Java诞生的时候C/C++横行的时候,要想立足,必须有调用C/C++程序,于是就在内存中专门开辟了一块区域处理标记为native的代码,它的具体作法是Native Method Stack中登记native方法,在Execution Engine执行时加载native libraies。
    目前该方法使用的越来越少了,除非是与硬件有关的应用,比如通过Java程序驱动打印机,或者Java系统管理生产设备,在企业级应用中已经比较少见。
    因为现在的异构领域间的通信很发达,比如可以使用Socket通信,也可以使用Web Service等。
2.3  Execution Engine 执行引擎:
    执行包在装载类的方法中的指令,也就是方法。
2.4 运行时区域(Rumtime data area):
    虚拟机内存或者JVM内存,从整个系统内存中开辟出来的一块区域用于存储JVM所需要的对象、变量等,运行时区域分为很多小块:方法区、虚拟机栈、本地方法栈、堆、程序计数器
3、JVM数据运行区域详解:
     说明:JVM调优主要就是优化  Heap堆 和  Method Area 方法区,如图:
    
3.1 Native Method Stack 本地方法栈
    它的具体做法是Native Method Stack中登记native方法,在Execution Engine执行时加载native libraies。
3.2 PC Register 程序计数器
     每个线程都有一个程序计算器,就是一个指针,指向方法区中的方法字节码(下一个将要执行的指令代码),由执行引擎读取下一条指令,是一个非常小的内存空间,几乎可以忽略不记。
3.3  Method Area方法区
         方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法如构造函数,接口代码也在此定义。简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间。
          静态变量+常量+类信息+运行时常量池存在方法区中,实例变量存在堆内存中。
3.4 Stack 栈
     ① 栈是什么
         栈也叫栈内存,主管Java程序的运行,是在线程创建时创建,它的生命期是跟随线程的生命期,线程结束栈内存也就释放,对于栈来说不存在垃圾回收问题,只要线程一结束该栈就Over,生命周期和线程一致,是线程私有的。
           基本类型的变量和对象的引用变量都是在函数的栈内存中分配。
     ② 栈存储什么?
     栈帧中主要保存3类数据:
          本地变量(Local Variables):输入参数和输出参数以及方法内的变量;
          栈操作(Operand Stack):记录出栈、入栈的操作;
          栈帧数据(Frame Data):包括类文件、方法等等。
     ③  运行原理
     栈中的数据都是以栈帧(Stack Frame)的格式存在,栈帧是一个内存区块,是一个数据集,是一个有关方法和运行期数据的数据集,当一个方法A被调用时就产生了一个栈帧F1,并被压入到栈中, A方法又调用了B方法,于是产生栈帧F2也被压入栈, B方法又调用了C方法,于是产生栈帧F3也被压入栈 …… 依次 执行完毕后,先弹出后进 ...... F3栈帧,再弹出F2栈帧,再弹出F1栈帧。

      遵循“先进后出”/“后进先出”原则。
3.5   Heap 堆
     堆这块区域是JVM中最大的,应用的对象和数据都是存在这个区域,这块区域也是线程共享的,也是 gc 主要的回收区, 一个 JVM 实例只存在一个堆类存,堆内存的大小是可以调节的。类加载器读取了类文件后,需要把类、方法、常变量放到堆内存中,以方便执行器执行,堆内存分为三部分:
    新生代、年老代、永久代
    3.5.1  新生代 是类的诞生、成长、消亡的区域,一个类在这里产生,应用,最后被垃圾回收器收集,结束生命。 新建的对象都是用新生代分配内存,Eden空间不足的时候,会把存活的对象转移到Survivor中,新生代大小可以由-Xmn来控制,也可以用-XX:SurvivorRatio来控制Eden和Survivor的比例。 当伊甸园的空间用完时,程序又需要创建对象,JVM的垃圾回收器将对伊甸园进行垃圾回收(Minor GC),将伊甸园中的剩余对象移动到幸存0区。若幸存0区也满了,再对该区进行垃圾回收,然后移动到1区。那如果1去也满了呢?再移动到养老区。若养老区也满了,那么这个时候将产生Major GC(FullGCC),进行养老区的内存清理。若养老区执行Full GC 之后发现依然无法进行对象的保存,就会产生OOM异常“OutOfMemoryError”。
      如果出现java.lang.OutOfMemoryError: Java heap space异常,说明Java虚拟机的堆内存不够。原因有二:
     a. Java虚拟机的堆内存设置不够,可以通过参数-Xms、-Xmx来调整。
       b. 代码中创建了大量大对象,并且长时间不能被垃圾收集器收集(存在被引用)。
    3.5.2 旧生代。用于存放新生代中经过多次垃圾回收仍然存活的对象
    3.5.3 持久带(Permanent Space)实现方法区,主要存放所有已加载的类信息,方法信息,常量池等等。可通过-XX:PermSize和-XX:MaxPermSize来指定持久带初始化值和最大值。Permanent Space并不等同于方法区,只不过是Hotspot JVM用Permanent Space来实现方法区而已,有些虚拟机没有Permanent Space而用其他机制来实现方法区。 永久存储区是一个常驻内存区域,用于存放JDK自身所携带的 Class,Interface 的元数据,也就是说它存储的是运行环境必须的类信息,被装载进此区域的数据是不会被垃圾回收器回收掉的,关闭 JVM 才会释放此区域所占用的内存。
       如果出现 java.lang.OutOfMemoryError: PermGen space ,说明是Java虚拟机对永久代Perm内存设置不够。 原因有二:
       a.   程序启动需要加载大量的第三方jar包。例如:在一个Tomcat下部署了太多的应用。
     b. 大量动态反射生成的类不断被加载,最终导致Perm区被占满。
特别说明1:
     说明:
     Jdk1.6及之前:常量池分配在永久代 。
     Jdk1.7:有,但已经逐步“去永久代” 。
     Jdk1.8及之后:无( java.lang.OutOfMemoryError: PermGen space,这种错误将不会出现在JDK1.8中 )


特别说明2- 方法区和堆内存的异议:
      实际而言,方法区和堆一样,是各个线程共享的内存区域,它用于存储虚拟机加载的:类信息+普通常量+静态常量+编译器编译后的代码等等,虽然JVM规范将方法区描述为堆的一个逻辑部分,但它却还有一个别名叫做Non-Heap(非堆),目的就是要和堆分开。
     对于HotSpot虚拟机,很多开发者习惯将方法区称之为“永久代(Parmanent Gen)”,但严格本质上说两者不同,或者说使用永久代来实现方法区而已,永久代是方法区的一个实现,jdk1.7的版本中,已经将原本放在永久代的字符串常量池移走。
     常量池(Constant Pool)是方法区的一部分,Class文件除了有类的版本、字段、方法、接口等描述信息外,还有一项信息就是常量池,这部分内容将在类加载后进入方法区的运行时常量池中存放。

JVM调优参数总结:
堆设置
-Xms:初始堆大小
-Xmx:最大堆大小
-XX:NewSize=n:设置年轻代大小
-XX:NewRatio=n:设置年轻代和年老代的比值。如:为3,表示年轻代与年老代比值为1:3,年轻代占整个年轻代年老代和的1/4
-XX:SurvivorRatio=n:年轻代中Eden区与两个Survivor区的比值。注意Survivor区有两个。如:3,表示Eden:Survivor=3:2,一个Survivor区占整个年轻代的1/5
-XX:MaxPermSize=n:设置持久代大小

收集器设置
-XX:+UseSerialGC:设置串行收集器
-XX:+UseParallelGC:设置并行收集器
-XX:+UseParalledlOldGC:设置并行年老代收集器
-XX:+UseConcMarkSweepGC:设置并发收集器

垃圾回收统计信息
-XX:+PrintGC
-XX:+PrintGCDetails
-XX:+PrintGCTimeStamps
-Xloggc:filename

并行收集器设置
-XX:ParallelGCThreads=n:设置并行收集器收集时使用的CPU数。并行收集线程数。
-XX:MaxGCPauseMillis=n:设置并行收集最大暂停时间
-XX:GCTimeRatio=n:设置垃圾回收时间占程序运行时间的百分比。公式为1/(1+n)

并发收集器设置
-XX:+CMSIncrementalMode:设置为增量模式。适用于单CPU情况。
-XX:ParallelGCThreads=n:设置并发收集器年轻代收集方式为并行收集时,使用的CPU数。并行收集线程数。

猜你喜欢

转载自blog.csdn.net/fushuai55231/article/details/80340665