记一次内部测试平台的性能故障分析排查过程--excel文件太大导致读取文件失败...

第一次报障

1、执行用例总是提示获取到dataprovider获取到的Object[][]为空

5295516-b1b18c71ed2d52df.png
Object[][]为空.png

2、在本地调试并不能每次复现,重启一下服务器就能好。没有明显的报错日志。

第一次问题定位

1、运行调试,发现总是读取表格文件的这一步

5295516-37b10471446caa81.png
读取表格文件.png

发现这里的错误只捕获了IOException。于是在抛出错误的时候,将IOException调整为Exception

5295516-06bce407e74333a3.png
修改为捕获Exception.png

一开始捕捉到的是一个NullPointException

于是第一次的解决方案是:加多一个NullPointException。

5295516-8c05576bbc2510cf.png
加多一个NullPointException.png

由于本地运行正常,所以就上线了并告诉大家修复了问题。

第二次报障

上线后,测试同学小美仍然反馈出执行不了的问题,然后重启之后,原本的文件就能够正常执行了,但是再上传一个新文件执行,同样会报这个错。

第二次问题定位

1、此时发现测试同学小美所使用的表格文件特别大。正常情况下只有200k左右的用例文件,执行有问题的文件居然高达4M。

5295516-a9e3120a0786c9b7.png
文件很大.png

考虑可能是4M的文件解析带来的问题,

于是在抛出错误的时候,再次调整为Exception

5295516-db829c5dd22cc307.png
修改为捕获Exception.png

【重现步骤】

1、先执行一次4M的文件的用例

2、执行完成后再上传一个4M的用例(上传用例过程在线上执行,直连线上的数据库,然后复制一份用例文件到本地执行)

3、使用新的文件执行用例

此时明确发现,是由于OOM内存溢出导致的问题

5295516-6727f6ef3223e648.png
OOM.png

于是打开jprofiler进行分析

1、第一次运行4m文件

5295516-f12bcc14efa29ff1.png
第一次运行4M.png

再上传一个新的4m文件,然后执行用例(上传用例过程在线上执行,直连线上的数据库,然后复制一份用例文件到本地执行)。

直接内存占用高达1.62G,GC100%运行,CPU未出现过载,所以性能瓶颈点主要在内存。判断可能存在内存泄漏。

5295516-8805760f40f3caa2.png
第二次运行4M.png
5295516-7ebb76d8994ad2d9.png
GC活动.png
5295516-1e5fb28016effcd5.png
cpu占用.png

另外还发现:超时还可能导致无法连接上zk,导致后续的测试无法继续执行

[图片上传失败...(image-5f70f9-1548245913902)]

但从上面只能定位到可能是内存泄漏,但未能定位到是什么原因导致,于是我们转向Live Memory

打开jprofiler的Live Memory,执行如下步骤:

1、先执行两个普通大小用例文件的用例,观察内存中那类占用比较多--此时没发现什么异常(所以没有截图)

2、再执行一个4M大小的用例。

发现下图中AttrXobj、ElementXobj暴涨。几乎占据了图中80%以上的量。

(后续还执行了第二个4M文件,但由于直接跑崩了所以没有收集到第二次4M文件执行的内存数据)

5295516-30130b1b6ad3a034.png
Live Memory.png

然后搜索AttrXobj(搜索AttrXobj),得知该类与XSSFWorkbook有关。

5295516-f194c895e4bb0959.png
搜索结果.png

并且

1、从第一条搜索结果可知(SXSSFWorkbook & XSSFWorkbook 效率比拼)XSSFWorkbook本身在大数据量下存在性能问题。

5295516-5fc2e6e8821e2c7b.png
image.png

2、在第四条记录上看到了非常类似情况:记一次FullGC的排查

5295516-c54bd1cc56fd7959.png
image.png

所以基本上定位到问题是处在我们ExcelUtils中用到的XSSFWorkbook对象身上。

最终解决思路

第一个:像记一次FullGC的排查这样限制用户上传文件大小

思考:虽然该方法成本最低。但由于用例文件可能会存放多个sheet,即使单个sheet数据量不超过100k,整个excel文件的总size无法预估,且无法解决根本问题,所以先不采取这个方法。

第二个:检查内存泄漏点,解决内存泄漏

从下图中可发现,黄框部分是执行完GC之后的内存占用情况,随着用例执行而增多。

5295516-fc79bf7291e2819e.png
内存占用趋势.png
5295516-ff52493afa47d7bf.png
读取表格方法的源码.png

结合两图可以定位到是XSSFWorkbook的问题。那我们关注到调用这个类的方法上。

从下图中可以看到,在方法中,有一个FileInputStream对象,但是读取了之后没有对应的关闭方法。

excelWBook、excelWsheet这两个对象是一个静态对象,在执行完操作之后,却没有进行对象的清空。可能会一直存活着。

从代码里也可以看到一个点:excelWBook这个变量是一个静态变量,第一次读取4M文件后,未被释放。然后到了第二次读取的时候,

excelWBook = new XSSFWorkbook(ExcelFile)

先执行new XSSFWorkbook(ExcelFile) 再将new出来的对象赋值给excelWBook。所以 此时 excelWBook占用一波内存,new XSSFWorkbook(ExcelFile)又要占用一波内存,导致直接内存爆掉了。

5295516-0b70e4a856bef168.png
修复前内存情况.png

【优化点】

1、将excelWSheet、excelWBook、cell从静态变量改为实例变量,释放内存。

2、加一个try-finally/try-with-resource关闭FileInputStream文件流。

3、使用SXSSFWorkbook替换XSSFWorkbook,降低内存开销。

参考文档

IntelliJ IDEA集成JProfiler,入门教程

SXSSFWorkbook & XSSFWorkbook 效率比拼

记一次FullGC的排查

修复结果

多次执行4M大小的文件响应正常且内存稳定。

5295516-a531467686607f64.png
修复后内存情况.png

修复后的关键源码

public static Object[][] getTableArray(String FilePath, String SheetName, int totalCols, Boolean isWithTitleRow) throws IOException {
    String[][] tabArray = (String[][])null;
    FileInputStream excelFile = null;

    try {
        excelFile = new FileInputStream(FilePath);
        XSSFWorkbook excelWBook = new XSSFWorkbook(excelFile);
        XSSFSheet excelWSheet = excelWBook.getSheet(SheetName);
        int startRow = 0;
        int startCol = 0;
        int lastRowNum = excelWSheet.getLastRowNum();
        int lastCol = totalCols - 1;
        if (isWithTitleRow) {
            startRow = 1;
        }

        int totalRow = getRealRowNum(excelWSheet, startRow, lastRowNum, startCol, lastCol);
        if (isWithTitleRow) {
            tabArray = new String[totalRow][totalCols];
        } else {
            tabArray = new String[totalRow + 1][totalCols];
        }

        for(int currentRow = startRow; currentRow <= totalRow; ++currentRow) {
            for(int currentCol = startCol; currentCol <= lastCol; ++currentCol) {
                tabArray[currentRow - startRow][currentCol] = getCellData(excelWSheet, currentRow, currentCol);
            }
        }
    } finally {
        if (excelFile != null) {
            excelFile.close();
        }

    }

    return tabArray;
}

猜你喜欢

转载自blog.csdn.net/weixin_34324081/article/details/87036926
今日推荐