七 JVM调优工具详解及调优实战

前置启动程序

事先启动一个web应用程序(这里是运行一个springBoot的一个jar包项目),用jps查看其进程id,接着用各种jdk自带命令优化应用
在这里插入图片描述

一 Jmap命令

此命令可以用来查看内存信息,实例个数以及占用内存大小

1.1 jmap -histo 查看实例

jmap -histo 14660  #查看历史生成的实例
jmap -histo:live 14660  #查看当前存活的实例,执行过程中可能会触发一次full gc

打开log.txt,文件内容如下:
在这里插入图片描述

  • num:序号
  • instances:实例数量
  • bytes:占用空间大小
  • class name:类名称,[C is a char[],[S is a short[],[I is a int[],[B is a byte[],[[I is a int[][]

1.2 jmap -heap 查看堆信息

在这里插入图片描述

1.3 jmap -dump 导出堆内存

可以导出当前时刻堆内存的快照信息,会生成一个文件,把这个文件可以放入可视化的工具(jvisualvm)里进行查看分析

jmap -dump:format=b,file=eureka.hprof 14660

在这里插入图片描述

也可以设置内存溢出时自动导出dump文件(内存很大的时候,可能会导不出来)

  1. -XX:+HeapDumpOnOutOfMemoryError
  2. -XX:HeapDumpPath=./ (路径)

1.4 jvisualvm命令

可以用jvisualvm命令工具导入1.3里的dump文件分析
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

示例代码:

public class OOMTest {
    
    

   public static List<Object> list = new ArrayList<>();

   // JVM设置    
   // -Xms10M -Xmx10M -XX:+PrintGCDetails -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=D:\jvm.dump 
   public static void main(String[] args) {
    
    
      List<Object> list = new ArrayList<>();
      int i = 0;
      int j = 0;
      while (true) {
    
    
         list.add(new User(i++, UUID.randomUUID().toString()));
         new User(j--, UUID.randomUUID().toString());
      }
   }
}

在这里插入图片描述
上边可知,user对象太多了,然后去查找代码找问题;那为什么String对象会太多呢?因为User类里有String类型的变量,不断new User时就会不断生成String类型的变量;为什么char[]数组会很多呢?因为String底层里就有char[]数组
在这里插入图片描述
在这里插入图片描述

其中, 下图的按钮,展示的是实时执行命令:jmap -histo 14660 (当前系统运行的情况)
在这里插入图片描述

二 Jstack命令

2.1 用jstack加进程id查找死锁,见如下示例

//模拟死锁
public class DeadLockTest {
    
    

   private static Object lock1 = new Object();
   private static Object lock2 = new Object();

   public static void main(String[] args) {
    
    
      new Thread(() -> {
    
    
         synchronized (lock1) {
    
    
            try {
    
    
               System.out.println("thread1 begin");
               Thread.sleep(5000);
            } catch (InterruptedException e) {
    
    
            }
            synchronized (lock2) {
    
    
               System.out.println("thread1 end");
            }
         }
      }).start();

      new Thread(() -> {
    
    
         synchronized (lock2) {
    
    
            try {
    
    
               System.out.println("thread2 begin");
               Thread.sleep(5000);
            } catch (InterruptedException e) {
    
    
            }
            synchronized (lock1) {
    
    
               System.out.println("thread2 end");
            }
         }
      }).start();

      System.out.println("main thread end");
   }
}

在这里插入图片描述

在这里插入图片描述
“Thread-1” 线程名
prio=5 优先级=5
tid=0x000000001fa9e000 线程id
nid=0x2d64 线程对应的本地线程标识nid
java.lang.Thread.State: BLOCKED 线程状态

在这里插入图片描述

还可以用jvisualvm自动检测死锁
在这里插入图片描述

点击右上方的按钮会显示死锁信息
在这里插入图片描述

远程连接jvisualvm
启动普通的jar程序JMX端口配置:
本案例的项目是springBoot项目生成的jar包(没有tomcat),对于普通javaweb项目,后边有操作步骤

# 一般不会这样连接,因为一般不允许本地连接生产环境(下一章节讲解生产环境怎么操作)
java -Dcom.sun.management.jmxremote.port=8888 -Djava.rmi.server.hostname=192.168.65.60 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false -jar microservice-eureka-server.jar

执行完上边命令后,在可视化窗口:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
连接成功
在这里插入图片描述

PS:
-Dcom.sun.management.jmxremote.port 为远程机器的JMX端口
-Djava.rmi.server.hostname 为远程机器IP

对于其他需要tomcat启动的项目,tomcat的JMX配置:在catalina.sh文件里的最后一个JAVA_OPTS的赋值语句下一行增加如下配置行

JAVA_OPTS="$JAVA_OPTS -Dcom.sun.management.jmxremote.port=8888 -Djava.rmi.server.hostname=192.168.50.60 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false"

连接时确认下端口是否通畅,可以临时关闭下防火墙

systemctl stop firewalld   #临时关闭防火墙

2.2 jstack找出占用cpu最高的线程堆栈信息

package com.tuling.jvm;

/**
 * 运行此代码,cpu会飙高
 */
public class Math {
    
    

    public static final int initData = 666;
    public static User user = new User();

    public int compute() {
    
      //一个方法对应一块栈帧内存区域
        int a = 1;
        int b = 2;
        int c = (a + b) * 10;
        return c;
    }

    public static void main(String[] args) {
    
    
        Math math = new Math();
        while (true){
    
    
            math.compute();
        }
    }
}

先新开一个窗口,执行top命令,查看cpu当前信息
在这里插入图片描述

在linux上运行这个类
在这里插入图片描述
查看cpu信息,发现CPU占用90%多了(此时报警系统就会报警):
在这里插入图片描述
定位cpu占用太高的步骤(之后有可视化工具的讲解,不需要像下边这么麻烦)

  1. 使用命令top -p ,显示你的java进程的内存情况,pid是你的java进程号,比如19663
    在这里插入图片描述
    结果:
    在这里插入图片描述

  2. 按H,获取当前进程下每个线程的内存情况
    在这里插入图片描述
    发现19664这个线程占用CPU太高

  3. 找到内存和cpu占用最高的线程tid,比如19664

  4. 把十进制的19664转为十六进制得到 0x4cd0(转进制百度即可),此为线程id的十六进制表示

  5. 执行 jstack 19664|grep -A 10 4cd0(注意要小写,百度转换后可能是大写),得到线程堆栈信息中 4cd0 这个线程所在行的后面10行,从堆栈中可以发现导致cpu飙高的调用方法
    在这里插入图片描述

  6. 查看对应的堆栈信息找出可能存在问题的代码

三 Jinfo命令

查看正在运行的Java应用程序的扩展参数

3.1 jinfo -flags

jinfo -flags 进程号
查看jvm的参数(自己配置的JVM参数信息)
在这里插入图片描述

3.2 jinfo -sysprops

jinfo -sysprops 进程号
查看java系统参数
在这里插入图片描述

Jstat

重点内容,JVM调优用到最多的命令就是Jstat;jstat命令可以查看堆内存各部分的使用量,以及加载类的数量。命令的格式如下:
jstat [-命令选项] [vmid] [间隔时间(毫秒)] [查询次数]

注意:这里使用的jdk版本是jdk8

4.1 垃圾回收统计

jstat -gc pid 最常用,可以评估程序内存使用及GC压力整体情况
在这里插入图片描述

S0C:第一个幸存区的大小,单位KB(S0、S1代表的就是前边章节年轻代里的S0、S1)
S1C:第二个幸存区的大小
S0U:第一个幸存区的使用大小(U代表using,即正在使用的容量)
S1U:第二个幸存区的使用大小
EC:伊甸园区的大小(E代表的就是前边章节年轻代里的伊甸园Eden区)
EU:伊甸园区的使用大小
OC:老年代大小(O代表old老年代区)
OU:老年代使用大小
MC:方法区大小(元空间)
MU:方法区使用大小
CCSC:压缩类空间大小(压缩指针,不重要)
CCSU:压缩类空间使用大小
YGC:年轻代垃圾回收次数(从项目启动开始统计的值)
YGCT:年轻代垃圾回收消耗时间,单位s
FGC:(Full GC)老年代垃圾回收次数
FGCT:老年代垃圾回收消耗时间,单位s
GCT:垃圾回收消耗总时间,单位s(YGCT+FGCT的和)

4.2 堆内存统计

在这里插入图片描述

NGCMN:新生代最小容量
NGCMX:新生代最大容量
NGC:当前新生代容量
S0C:第一个幸存区大小
S1C:第二个幸存区的大小
EC:伊甸园区的大小
OGCMN:老年代最小容量
OGCMX:老年代最大容量
OGC:当前老年代大小
OC:当前老年代大小
MCMN:最小元数据容量
MCMX:最大元数据容量
MC:当前元数据空间大小
CCSMN:最小压缩类空间大小
CCSMX:最大压缩类空间大小
CCSC:当前压缩类空间大小
YGC:年轻代gc次数
FGC:老年代GC次数

4.3 新生代垃圾回收统计

在这里插入图片描述
S0C:第一个幸存区的大小
S1C:第二个幸存区的大小
S0U:第一个幸存区的使用大小
S1U:第二个幸存区的使用大小
TT:对象在新生代存活的次数
MTT:对象在新生代存活的最大次数
DSS:期望的幸存区大小
EC:伊甸园区的大小
EU:伊甸园区的使用大小
YGC:年轻代垃圾回收次数
YGCT:年轻代垃圾回收消耗时间

4.4 新生代内存统计

在这里插入图片描述

NGCMN:新生代最小容量
NGCMX:新生代最大容量
NGC:当前新生代容量
S0CMX:最大幸存1区大小
S0C:当前幸存1区大小
S1CMX:最大幸存2区大小
S1C:当前幸存2区大小
ECMX:最大伊甸园区大小
EC:当前伊甸园区大小
YGC:年轻代垃圾回收次数
FGC:老年代回收次数

4.5 老年代垃圾回收统计

在这里插入图片描述
MC:方法区大小
MU:方法区使用大小
CCSC:压缩类空间大小
CCSU:压缩类空间使用大小
OC:老年代大小
OU:老年代使用大小
YGC:年轻代垃圾回收次数
FGC:老年代垃圾回收次数
FGCT:老年代垃圾回收消耗时间
GCT:垃圾回收消耗总时间

4.6 老年代内存统计

在这里插入图片描述
OGCMN:老年代最小容量
OGCMX:老年代最大容量
OGC:当前老年代大小
OC:老年代大小
YGC:年轻代垃圾回收次数
FGC:老年代垃圾回收次数
FGCT:老年代垃圾回收消耗时间
GCT:垃圾回收消耗总时间

4.7 元数据空间统计

在这里插入图片描述
MCMN:最小元数据容量
MCMX:最大元数据容量
MC:当前元数据空间大小
CCSMN:最小压缩类空间大小
CCSMX:最大压缩类空间大小
CCSC:当前压缩类空间大小
YGC:年轻代垃圾回收次数
FGC:老年代垃圾回收次数
FGCT:老年代垃圾回收消耗时间
GCT:垃圾回收消耗总时间
在这里插入图片描述
S0:幸存1区当前使用比例
S1:幸存2区当前使用比例
E:伊甸园区使用比例
O:老年代使用比例
M:元数据区使用比例
CCS:压缩使用比例
YGC:年轻代垃圾回收次数
FGC:老年代垃圾回收次数
FGCT:老年代垃圾回收消耗时间
GCT:垃圾回收消耗总时间

4.8 JVM运行情况预估

用 jstat gc -pid 命令可以计算出如下一些关键数据,有了这些数据就可以采用之前介绍过的优化思路,先给自己的系统设置一些初始性的JVM参数,比如堆内存大小,年轻代大小,Eden和Survivor的比例,老年代的大小,大对象的阈值,大龄对象进入老年代的阈值等。

年轻代对象增长的速率
可以执行命令 jstat -gc pid 1000 10 (每隔1秒执行1次命令,共执行10次),通过观察EU(eden区的使用)来估算每秒eden大概新增多少对象,如果系统负载不高,可以把频率1秒换成1分钟,甚至10分钟来观察整体情况。注意,一般系统可能有高峰期和日常期,所以需要在不同的时间分别估算不同情况下对象增长速率。

每隔一秒输出一次
在这里插入图片描述

Young GC的触发频率和每次耗时
知道年轻代对象增长速率我们就能推根据eden区的大小推算出Young GC大概多久触发一次,Young GC的平均耗时可以通过 YGCT/YGC 公式算出,根据结果我们大概就能知道系统大概多久会因为Young GC的执行而卡顿多久。

每次Young GC后有多少对象存活和进入老年代
这个因为之前已经大概知道Young GC的频率,假设是每5分钟一次,那么可以执行命令 jstat -gc pid 300000 10 ,观察每次结果eden,survivor和老年代使用的变化情况,在每次gc后eden区使用一般会大幅减少,survivor和老年代都有可能增长,这些增长的对象就是每次Young GC后存活的对象,同时还可以看出每次Young GC后进去老年代大概多少对象,从而可以推算出老年代对象增长速率。

Full GC的触发频率和每次耗时
知道了老年代对象的增长速率就可以推算出Full GC的触发频率了,Full GC的每次耗时可以用公式 FGCT/FGC 计算得出。

优化思路其实简单来说就是尽量让每次Young GC后的存活对象小于Survivor区域的50%,都留存在年轻代里。尽量别让对象进入老年代。尽量减少Full GC的频率,避免频繁Full GC对JVM性能的影响。即最终优化的目的是要减少FullGc的次数;

五 系统频繁Full GC导致系统卡顿是怎么回事

  • 机器配置:2核4G
  • JVM内存大小:2G
  • 系统运行时间:7天
  • 期间发生的Full GC次数和耗时:500多次,200多秒
  • 期间发生的Young GC次数和耗时:1万多次,500多秒

大致算下来每天会发生70多次Full GC,平均每小时3次(正常几小时甚至几天才发生一次FullGC),每次Full GC在400毫秒左右;
每天会发生1000多次Young GC,每分钟会发生1次,每次Young GC在50毫秒左右。

发生上边情况的JVM参数设置如下:

-Xms1536M -Xmx1536M -Xmn512M -Xss256K -XX:SurvivorRatio=6  -XX:MetaspaceSize=256M -XX:MaxMetaspaceSize=256M 
-XX:+UseParNewGC  -XX:+UseConcMarkSweepGC  -XX:CMSInitiatingOccupancyFraction=75 -XX:+UseCMSInitiatingOccupancyOnly 

根据上边的配置可知:
-Xms1536M -Xmx1536M:总共堆是1.5G
-Xmn512M :年轻代512M
SurvivorRatio=6:即eden:S0:S1是6:1:1(总共512M),所以eden384M,S0与S1各自64M
因为堆总大小1.5G,年轻代是512M,所以老年代大小是1G;
-XX:CMSInitiatingOccupancyFraction=75:老年代被占用75%的时候触发FullGC

上边已经计算过了,平均每分钟一次YangGC,即每分钟Eden区就被放满了,所以每秒大概有6M对象放进了Eden区;

同样,上边已经算过了,平均每小时3次FullGC,即20分钟一次,而老年代内存为1G,也就是说20分钟里有700M(-XX:CMSInitiatingOccupancyFraction=75参数代表老年代被占75%的时候触发FullGC)对象挪到了老年代(当然有可能不是从年轻代里挪过来的,比如大对像直接进入老年代);

由以上信息可以得到以下对象流转速率
在这里插入图片描述
现在要思考的问题就是:为什么每隔20分钟就有700M对象进入老年代从而触发FullGC了,以及怎么解决这个问题;这个问题需要我们结合自己对系统的了解去进行评估;

大家可以结合对象挪动到老年代那些规则(第三章节)推理下我们这个程序可能存在的一些问题;;比如系统哪里会产生大对像(大对像直接进入老年代)、长期存活的对象(这种对象对象最终进入老年代)、对象动态年龄判断机制、老年代空间分配担保机制等(这些都是第三章节的内容)

经过分析感觉可能会由于对象动态年龄判断机制导致full gc较为频繁

为了给大家看效果,我模拟了一个示例程序(见课程对应工程代码:jvm-full-gc),打印了jstat的结果如下:

jstat -gc 13456 2000 10000

在这里插入图片描述
对于对象动态年龄判断机制导致的full gc较为频繁可以先试着优化下JVM参数,把年轻代适当调大点:

-Xms1536M -Xmx1536M -Xmn1024M -Xss256K -XX:SurvivorRatio=6  -XX:MetaspaceSize=256M -XX:MaxMetaspaceSize=256M 
-XX:+UseParNewGC  -XX:+UseConcMarkSweepGC  -XX:CMSInitiatingOccupancyFraction=92 -XX:+UseCMSInitiatingOccupancyOnly 

在这里插入图片描述
优化完发现没什么变化,full gc的次数比minor gc的次数还多了
在这里插入图片描述
我们可以推测下full gc比minor gc还多的原因有哪些?
1、元空间不够导致的多余full gc(上图MU列基本没变化,所以排除这种可能)
2、显示调用System.gc()造成多余的full gc,这种一般线上尽量通过-XX:+DisableExplicitGC参数禁用,如果加上了这个JVM启动参数,那么代码中调用System.gc()没有任何效果
3、老年代空间分配担保机制(第三章节:平均每触发一次minorGC,就会触发两次FullGC,即minorGC前一次FullGC,接着做minorGC,此时老年代又满了,就又做了一次FullGC)

最快速度分析完这些我们推测的原因以及优化后,我们发现young gc和full gc依然很频繁了,而且看到有大量的对象频繁的被挪动到老年代,这种情况我们可以借助jmap命令大概看下是什么对象
在这里插入图片描述
查到了有大量User对象产生,这个可能是问题所在,但不确定,还必须找到对应的代码确认,如何去找对应的代码了?
1、代码里全文搜索生成User对象的地方(适合只有少数几处地方的情况)
2、如果生成User对象的地方太多,无法定位具体代码,我们可以同时分析下占用cpu较高的线程,一般有大量对象不断产生,对应的方法代码肯定会被频繁调用,占用的cpu必然较高

查看系统实时运行情况:
在这里插入图片描述

可以用上面讲过的jstack或jvisualvm来定位cpu使用较高的代码,最终定位到的代码如下:
发现是一个byte[]数组太大了,光靠这个是找不到问题的,那就以此往下找,发现了一个系统里熟悉的类(其他类是jdk自带的,很难找到问题)
在这里插入图片描述
发现user对象有5000多个实例,有120000字节数,这样就基本定位到了问题所在;

代码少的话,全文搜索检查系统里new user的地方,查看代码逻辑即可;new user地方比较多的话,就不能全局搜索了,太费事,可以查看哪些代码占用CPU时间比较长:
在这里插入图片描述
上边还是定位不到具体位置,继续往下看发现了具体的占用cpu高的方法了
在这里插入图片描述
对应去项目里找代码
在这里插入图片描述

import java.util.ArrayList;

@RestController
public class IndexController {
    
    

    @RequestMapping("/user/process")
    public String processUserData() throws InterruptedException {
    
    
        ArrayList<User> users = queryUsers();

        for (User user: users) {
    
    
            //TODO 业务处理
            System.out.println("user:" + user.toString());
        }
        return "end";
    }

    /**
     * 模拟批量查询用户场景
     * @return
     */
    private ArrayList<User> queryUsers() {
    
    
        ArrayList<User> users = new ArrayList<>();
        for (int i = 0; i < 5000; i++) {
    
    
            users.add(new User(i,"zhuge"));
        }
        return users;
    }
}

同时,java的代码也是需要优化的,一次查询出500M的对象出来,明显不合适,要根据之前说的各种原则尽量优化到合适的值,尽量消除这种朝生夕死的对象导致的full gc

解决:
上边代码循环5000太多了(主要是user对象里有大的成员变量),改为500
在这里插入图片描述
问题解决,基本不会FullGC了

六 内存泄露到底是怎么回事

内存泄露:之前用了这个对象,用完没有及时回收;

再给大家讲一种情况,一般电商架构可能会使用多级缓存架构,就是redis加上JVM级缓存,大多数同学可能为了图方便对于JVM级缓存就简单使用一个hashmap(不处理过期的缓存),于是不断往里面放缓存数据,但是很少考虑这个map的容量问题,结果这个缓存map越来越大,一直占用着老年代的很多空间,时间长了就会导致full gc非常频繁,这就是一种内存泄漏,对于一些老旧数据没有及时清理导致一直占用着宝贵的内存资源,时间长了除了导致full gc,还有可能导致OOM。

这种情况完全可以考虑采用一些成熟的JVM级缓存框架来解决,比如ehcache等自带一些LRU数据淘汰算法(过期算法,淘汰掉用完的老对象)的框架来作为JVM级的缓存。

猜你喜欢

转载自blog.csdn.net/qq_33417321/article/details/119189859