记录一次生产环境下的jvm内存泄露问题和分析解决过程 - 代码天地

记录一次生产环境下的jvm内存泄露问题和分析解决过程

其他 2019-03-02 10:10:59 阅读次数: 0

版权声明：随便转, 记得给个链接过来哦 https://blog.csdn.net/wk52525/article/details/84566560

发现异常

首先通过我们内部搭建的日志平台发现我们线上环境一个java应用有大量的http接口请求超时，登录linux服务器查看网络环境没有问题，判断是应用自身运行异常，重启应用后发现异常还在，开始查找问题。

初步查找问题

通过指令： jstat -gcutil 查看jvm内存占用和gc情况：
发现老年代内存占用比例过高，并且每次fullGC后并没有有效回收。老年代内存占用百分比变化趋势大致如下：
初步判断大量请求超时和服务瘫痪的直接原因：
- 每次fullGC后的内存占用越来越高
- 内存占用增长速度越来越快
- fullGC的频率越来越高
- 最终占用达到100%，服务完全瘫痪

分析处理

使用指令：jmap -histo:live *** | more 查看堆内存中的对象数量和大小
- 发现Log4jLogEvent这个对象实例很多，占用内存也异常的大，初步分析是异步日志传输速度跟不上，导致日志对象堆积在内存中。
尝试使用调整Flume传输日志参数：提高flume单词传输量，减少最大延迟时间
重启应用并监控接口调用情况发现应用暂时恢复正常了。

后续分析

在前一步分析内存的同时，使用指令：jmap -dump:format=b,file=serviceDump.dat将实时内存信息导出（dump过程比较慢，所以在问题暂时处理完后进行后续分析），使用mat分析内存结构：
- 可以看到主要占据堆内存的对象信息，果然是Flume异步传输日志堵塞的问题。

总结

对jvm内存泄露这类问题的解决，主要是要善于利用jvm提供的类似jstat、jmap等工具来分析查找问题。这次问题虽然解决，但是后续还是存在出现此类问题的风险。所以除了加强jvm问题排查能力的同时，我们也将建立应用监控平台的计划提上日程，希望能对jvm内存、线程等应用实时运行指标进行监控，便于尽早发现问题。

猜你喜欢

转载自blog.csdn.net/wk52525/article/details/84566560

记录一次生产环境下的jvm内存泄露问题和分析解决过程

记一次生产环境Nginx 502 bad gateway问题分析解决过程

【Java 教程】JVM垃圾回收与一次线上内存泄露问题分析和解决过程

一次生产内存溢出记录

JVM性能分析 | 一次生产系统Full GC问题分析与排查总结

记录一次生产环境中 Redis 内存增长异常排查全流程

记录一次jvm内存泄露的问题

【php】记录一次生产环境bug的调试

记录一次生产环境OOM

只需4个步骤，分析解决在生产环境下JVM内存泄露问题

记录一次生产上的OOM解决过程

一次生产的JVM优化

一次生产问题排查解决过程（小问题，大神请绕过）

问题解决：记录一次Java程序内存泄露的解决过程（proxool内存泄露）

MYSQL 分享一次生产环境的死锁事故原因和排查过程

记录一次生产上暴力解决HBase RIT问题

记一次生产环境问题解决案例(k8s环境)

Redis:记录一次生产环境部署出现 ERR unknown command ‘XREADGROUP‘问题，导致启动失败

记一次生产环境存储过程优化的过程（42秒--＞0.06秒）

一次生产的 JVM 优化案例

记一次生产环境内存占用过高的排查

一次生产环境单机日志不打印的排查过程

记录一次生产环境hadoop集群优化以及pid文件缺失处理

一次生产环境搭建11g RAC的记录

一次大量 JVM Native 内存泄露的排查分析（64M 问题）

记一次生产线程数耗尽，导致内存溢出(outOfMemoryError)问题

记录一次生产上的SpringCloudFeign的重试问题

记录一次生产的java.io.IOException: Too many open files问题

记一次生产环境事务超时

记一次生产环境的严重bug

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)