第1章 JVM调优前言篇

第1章 JVM调优前言篇
第2章 JVM监控及诊断工具_命令行篇
第3章 JVM监控及诊断工具_GUI篇
第4章 JVM运行时参数篇
第5章 JVM中GC日志分析篇

1 大厂面试题

  1. 支付宝:
    支付宝三面:JVM性能调优都做了什么?

  2. 小米:
    有做过JVM内存优化吗?
    从sql、jvm、架构、数据库四个方面讲讲优化的思路。

  3. 蚂蚁金服:
    jvm的编译优化?
    jvm性能调优都做了什么?
    jvm诊断调优工具用过哪些?
    二面:jvm怎样调优;堆内存、栈空间设计多少合适?
    三面:jvm相关的分析工具使用过的有哪些?具体的性能调优步骤如何?

  4. 阿里:
    如何进行jvm调优?有哪些方法?
    如何理解内存泄漏问题?有哪些情况会导致内存泄漏?如何解决?

  5. 字节跳动:
    三面:jvm如何调优?参数怎么调?

  6. 拼多多:
    从sql、jvm、架构、数据库四个方面讲讲优化的思路。

  7. 京东:
    jvm诊断调优工具用过哪些?
    每秒几十万并发的秒杀系统为什么会频繁发生GC?
    日均百万级交易系统如何优化JVM?
    线上生成系统OOM如何监控及定位与解决?
    高并发系统如何基于G1垃圾回收器优化性能?

2 背景说明

2.1 生产环境中的问题

生产环境发生了内存溢出该如何处理?
生产环境应该给服务器分配多少内存合适?
如何对垃圾回收器的性能进行调优?
生产环境CPU负载飙高该如何处理?
生产环境应该给应用分配多少线程合适?
不加log,如何确定请求是否执行了某一行代码?
不加log,如何实时查看某个方法的入参与返回值?

2.2 为什么要调优?

防止出现OOM
解决OOM
减少Full GC出现的频率

2.3 不同阶段的考虑

上线前
项目运行阶段
线上出现OOM

3 调优概述

3.1 监控的依据

运行日志
异常堆栈
GC日志
线程快照
堆转储快照

3.2 调优的大方向

合理地编写代码
充分并合理的使用硬件资源
合理地进行JVM调优

4 性能优化的三步骤

4.1 第1步(发现问题):性能监控

一种以非强行或者入侵方式收集或查看应用运营性能数据的活动。
监控通常是指一种在生产、质量评估或者开发环境下实施的带有预防或主动性的活动。
当应用相关干系人提出性能问题却没有提供足够多的线索时,首先我们需要进行性能监控随后性能分析

GC频繁
CPU load过高
OOM
内存泄漏
死锁
程序响应时间较长

4.2 第2步(排查问题):性能分析

一种以侵入方式收集运行性能数据的活动,它会影响应用的吞吐量或响应性。
性能分析是针对性能问题的答复结果,关注的范围通常比性能监控更加集中。
性能分析很少在生产环境下进行,通常是在质量评估、系统测试或者开发环境下进行,是性能监控之后的步骤。

打印GC日志,通过GCviewer或老http://gceasy.io来分析日志信息
灵活运用命令行工具,jstack,jmap,jinfo等
dump出堆文件,使用内存分析工具分析文件
使用阿里Arthas,或jconsole,JVisualVM来实时查看JVM状态
jstack查看堆栈信息

4.3 第3步(解决问题):性能调优

一种为改善应用响应性能或吞吐量而更改参数、源代码、属性配置的活动,性能调优是在性能监控、性能分析之后的活动

适当增加内存,根据业务背景选择垃圾回收器
优化代码,控制内存使用
增加机器,分散节点压力
合理设置线程池线程数量
使用中间件提高程序效率,比如缓存,消息队列等
其他…

5 四个性能评价/测试指标 与 相关关系

5.1 响应时间(或停顿时间)

提交请求和返回该请求的响应之间使用的时间,一般比较关注平均响应时间。
常用操作的响应时间列表:

操作 响应时间
打开一个站点 几秒
数据库查询一条记录(有索引) 十几毫秒
机械磁盘一次寻址定位 4 毫秒
从机械磁盘顺序读取 1M 数据 2 毫秒
从 SSD 盘顺序读取 1M 据 0.3 毫秒
从远程分布式换成 Redis 读取一个数据 0.5 毫秒
从内存读取 1M 数据 十几微妙
Java 程序本地方法调用 几微妙
网络传输 2Kb 数据 1 微妙

在垃圾回收环节中:
暂停时间:执行垃圾收集时,程序的工作线程被暂停的时间。
-XX:MaxGCPauseMillis

5.2 吞吐量

对单位时间内完成的工作量(请求)的量度。

在GC中:运行用户代码的时间占总运行时间的比例
(总运行时间:程序的运行时间 + 内存回收的时间)
吞吐量为1 - 1 / (1 + n)-XX:GCTimeRatio=n

5.3 并发数

同一时刻,对服务器有实际交互的请求数 。

1000个人同时在线,估计并发数在 5% -15% 之间,也就是同时并发量 50-150 之间。

5.4 内存占用

Java堆区 所占的内存大小。

5.5 四个指标间的相互关系

以高速公路通行状况为例
吞吐量:每天通过高速公路收费站的车辆的数据(也可以理解为收费站收取的高速费)。
并发数:高速公路上正在行驶的车辆的数目。
响应时间:车速。

猜你喜欢

转载自blog.csdn.net/Michael_lcf/article/details/109472796