记一次使用sax方式解析excel仍内存溢出的问题

apache官方提供了使用sax方式处理大数据量的xlsx文件,可以防止内存的溢出,经过测试其实是占用的内存大大减少,但是最近在使用的时候发现使用了sax内存仍然会飙到2G,甚至3G,一开始找不到原因

使用jmap -histo命令显示内存中创建的实例数量

 num     #instances         #bytes  class name
----------------------------------------------
   1:          1386      765536640  [B
   2:          7679         688056  [C
   3:          1640         187744  java.lang.Class
   4:          7515         180360  java.lang.String
   5:          1088          73896  [Ljava.lang.Object;
   6:           958          59960  [I

发现Byte的占用非常的高,心想应该是流的问题,但是查看代码发现代码中流使用合理,正常关闭,然后查看了poi使用的方法,发现了内存飙升的地方在调用

OPCPackage pkg = OPCPackage.open(file);
后通过查看源码,open有多个重载,我使用的是参数为InputStream的重载,官方文档上写的是File,我当时为了方便直接使用了InputStream的重载,结果发现两个重载对文件的处理不一样,如果使用InputStream的重载,会出现内存飙升的情况,换成File的就没事了

猜你喜欢

转载自blog.csdn.net/u011856283/article/details/80091410