记一次生产环境的严重bug - 代码天地

记一次生产环境的严重bug

其他 2019-01-31 00:00:48 阅读次数: 0

在系统部署生产环境后，在十天左右就会出现系统反应慢，堆爆了，cpu占用百分百的情况。在重启tomcat后情况就恢复了。

在经过详细的跟踪，线程dump, 堆dump 下来分析后，线程没有问题，发现有两个原因：

1：通过memory analyzer 分析堆dump文件后，有一个缓存对象无限增长，并保持活动，导致回收不了，堆爆掉。

2：由于后台频繁gc, 导致系统响应慢，导致 liunx服务器的 time_wait 连接数量飙升，参数没有设置：将超时等待的连接用于新的连接。导致前台请求不够。

解决方案：

1: 缓存对象无限增长回收不了的问题解决方案为：本来使用过后不用的对象应该移除的，没有移除成功，将此bug修复，保持增长和移除相对稳定。

2：超时等待的原因解决：文章地址： https://www.aliyun.com/jiaocheng/810456.html

这个命令是查询连接数：

netstat -n | awk '/^tcp/ {++state[$NF]} END {for(key in state) print key,"/t",state[key]}'
TIME_WAIT 250263

TIME_WAIT 250263
CLOSE_WAIT 57
FIN_WAIT2 3
ESTABLISHED 2463
SYN_RECV 8

time_wait 数量过多：

可以修改系统的/etc/sysctl.conf配置来减少TIME_WAIT的tcp连接:
vi /etc/sysctl.conf
net.ipv4.tcp_syncookies = 1(某些情况下该参数已启用)
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_fin_timeout = 30

然后执行/sbin/sysctl -p让参数生效。再用命令查看TIME_WAIT连接数 netstat -ae | grep “TIME_WAIT” |wc -l 发现大量的TIME_WAIT 已不存在。

这个图片为：出现卡顿时的 jvisualvm 的监控， cpu使用百分比，频繁gc, 堆使用百分百。

以下图片为 memory Analyzer 工具分析堆dump文件的图像

以下图片为老区中无限增长的对象的类名，对象及大小。

猜你喜欢

转载自blog.csdn.net/tang_jian_dong/article/details/86479575

记一次生产环境的严重bug

MongoDB：记一次生产环境中mongo出现的严重出错与排查解决

记一次生产Slor分组的bug

【php】记录一次生产环境bug的调试

记一次生产环境事务超时

记一次生产环境线程阻塞的排查

记一次生产事故

记一次生产环境MySQL数据库的备份与还原

记一次生产环境nginx图片上传不了的问题

记一次生产环境CPU飙升100%的排查经历

记一次生产环境中挖矿病毒的处理

记一次生产环境Nginx 502 bad gateway问题分析解决过程

记一次生产环境部分节点AccessToken失效问题

记一次生产环境存储过程优化的过程（42秒--＞0.06秒）

记一次生产环境mysql锁表问题的处理

记一次生产环境删除数据问题

记一次生产环境内存占用过高的排查

记一次生产环境的轻量级资源监控（自用）

记一次生产多线程调优

记一次生产请求耗时的问题

记一次生产数据库事故

记一次生产故障，nginx503

记一次生产故障问题排查

记一次生产慢sql查询的解决

记录一次生产环境OOM

记一次生产环境问题解决案例(k8s环境)

记一次生产环境物理机磁盘/目录被日志打满处理方式（logrotate失效）

记一次生产环境上基于binlog日志恢复数据库案例

一次生产的JVM优化

记一次生产问题--CompletableFuture默认线程池

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)