百万级excel表导出如何优化？

应对百万级excel表的导出，主流的优化方式有：分批次导出、使用SXSSFWorkbook、优化SQL或使用缓存、压缩文件大小、调整JVM参数避免OOM等等方式。

【分批次导出】

将数据分成多个批次导出，每次导出一部分数据，避免一次性导出过多数据导致内存溢出。可以使用 Spring Batch 来实现。Spring Batch 是一个轻量级的批处理框架，可以帮助我们高效地处理大量数据。具体实现步骤如下：

1、定义 ItemReader：定义一个读取数据的 ItemReader，用来读取数据并返回给 Spring Batch。

2、定义 ItemProcessor：定义一个处理数据的 ItemProcessor，用来将读取到的数据进行处理，处理后的数据再返回给 Spring Batch。

3、定义 ItemWriter：定义一个写数据的 ItemWriter，用来将处理后的数据写入到 Excel 文件中。

4、定义 Step：将 ItemReader、ItemProcessor 和 ItemWriter 组合在一起，定义一个 Step。

5、定义 Job：将一个或多个 Step 组合在一起，定义一个 Job。

【使用SXSSFWorkbook】

SXSSFWorkbook 是 POI 提供的一种针对大量数据的优化版本，可以将大量数据写入到磁盘中，避免将所有数据都存储在内存中。具体实现步骤如下：

1、导入依赖：在 pom.xml 文件中导入 poi-ooxml 和 poi-ooxml-schemas 依赖。

2、创建 SXSSFWorkbook：创建一个 SXSSFWorkbook 对象。

3、创建 Sheet：创建一个 Sheet 对象。

4、创建 Row：创建一个 Row 对象。

5、创建 Cell：创建一个 Cell 对象。

6、写入数据：将数据写入到 Cell 中。

7、输出 Excel：将 SXSSFWorkbook 输出到 OutputStream 中。

【优化导出速度】

可以通过对导出过程进行优化，包括对 SQL 查询语句进行优化，使用缓存等方式来提升导出速度。具体实现步骤如下：

1、优化 SQL 查询语句：可以使用索引、优化 SQL 查询语句等方式来提升查询速度。

2、使用缓存：可以将查询到的数据缓存到内存中，避免重复查询数据库。

【压缩文件大小】

可以将导出的 Excel 文件进行压缩，减小文件大小，提高导出速度。可以使用 ZIP 或 GZIP 等压缩方式。具体实现步骤如下：

1、导入依赖：在 pom.xml 文件中导入 commons-compress 依赖。

2、创建压缩文件：创建一个 ZipOutputStream 或 GZIPOutputStream 对象。

3、创建 Excel 文件：创建一个 SXSSFWorkbook 对象。

4、将 Excel 文件写入到压缩文件中：将 SXSSFWorkbook 输出到 ZipOutputStream 或 GZIPOutputStream 对象中。

【避免OOM】

在导出时，需要注意内存占用情况，避免内存溢出。可以通过适当调整 JVM 内存参数来解决。具体实现步骤如下：

1、调整 JVM 内存参数：可以通过设置 JVM 内存参数 -Xms 和 -Xmx 来调整 JVM 内存大小。

2、分批次导出：将数据分成多个批次导出，每次导出一部分数据，避免一次性导出过多数据导致内存溢出。

总之，在实现百万级的 Excel 导出时，需要综合考虑多个方面的优化，尽可能减少导出时间和内存占用。