如何解决Java EasyExcel 导出报内存溢出

🕗 发布于 2024-11-22 02:19 java 开发语言 分布式物联网网络

如何解决Java EasyExcel 导出报内存溢出

EasyExcel大数据量导出常见方法

1. 分批写入

EasyExcel支持分批写入数据，可以将数据分批加载到内存中，分批写入Excel文件，避免一次性将大量数据加载到内存中。

示例代码：

String fileName = "large_data.xlsx";
 ExcelWriter excelWriter = EasyExcel.write(fileName).build();
 WriteSheet writeSheet = EasyExcel.writerSheet("Sheet1").build();

 // 假设每次写入10000条数据
 int batchSize = 10000;
 List<Data> dataList;
 int pageIndex = 0;
 do {
     // 分页获取数据
     dataList = getDataByPage(pageIndex++, batchSize);
     excelWriter.write(dataList, writeSheet);
 } while (dataList.size() == batchSize);

 // 关闭资源
 excelWriter.finish();

2. 设置合适的JVM内存

针对大数据导出场景，可以尝试增大JVM的内存分配，例如：
```
java -Xms512M -Xmx4G -jar yourApp.jar
```
解释：
- -Xms512M：设置初始堆大小为512MB。
- -Xmx4G：设置最大堆大小为4GB。

3. 减少数据对象的复杂性

导出数据时，尽量简化数据对象，避免不必要的嵌套和多余字段的加载，以减少对象占用的内存空间。

4. 关闭自动列宽设置

EasyExcel的自动列宽功能会占用大量内存，特别是在数据量较大的情况下。关闭自动列宽可以节省内存。

示例代码：

EasyExcel.write(fileName)
           .registerWriteHandler(new SimpleWriteHandler()) // 不使用自动列宽
           .sheet("Sheet1")
           .doWrite(dataList);

5. 使用Stream导出（适合大数据）

利用OutputStream分批写入数据，减少内存消耗。通过BufferedOutputStream可以进一步提高性能。

示例代码：

try (OutputStream out = new BufferedOutputStream(new FileOutputStream(fileName))) {
       ExcelWriter excelWriter = EasyExcel.write(out).build();
       WriteSheet writeSheet = EasyExcel.writerSheet("Sheet1").build();
       int pageIndex = 0;
       List<Data> dataList;
       do {
           dataList = getDataByPage(pageIndex++, batchSize);
           excelWriter.write(dataList, writeSheet);
       } while (dataList.size() == batchSize);
       excelWriter.finish();
   } catch (IOException e) {
       e.printStackTrace();
   }

6. 选择合适的数据导出工具

如果数据量非常大，可以考虑切换到支持更高性能的导出工具（如Apache POI的SXSSFWorkbook），适合导出百万级别数据量，但配置和使用会更复杂。

亮点来了，那要如何使用 POI 的 SXSSFWorkbook来导出百万级别的数据量呢？

Apache POI的SXSSFWorkbook 实现百万级别数据量的导出案例

使用Apache POI的SXSSFWorkbook可以处理大数据量的Excel导出，因为SXSSFWorkbook基于流式写入，不会将所有数据加载到内存中，而是使用临时文件进行缓存，这样可以显著减少内存消耗，适合百万级别数据的导出。下面我们来看一个完整的实现示例。

代码如下

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.streaming.SXSSFWorkbook;

import java.io.FileOutputStream;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

public class LargeDataExportExample {

    public static void main(String[] args) {
        // 文件输出路径
        String filePath = "vg_large_data_export.xlsx";
        
        // 导出百万级数据
        exportLargeData(filePath);
    }

    private static void exportLargeData(String filePath) {
        // 每次写入的批次大小
        final int batchSize = 10000;
        // 数据总条数
        final int totalRows = 1_000_000;

        // 创建SXSSFWorkbook对象，内存中只保留100行，超过的部分会写入临时文件
        SXSSFWorkbook workbook = new SXSSFWorkbook(100);
        workbook.setCompressTempFiles(true); // 启用临时文件压缩

        // 创建工作表
        Sheet sheet = workbook.createSheet("Large Data");

        // 创建标题行
        Row headerRow = sheet.createRow(0);
        String[] headers = {"ID", "Name", "Age"};
        for (int i = 0; i < headers.length; i++) {
            Cell cell = headerRow.createCell(i);
            cell.setCellValue(headers[i]);
        }

        int rowNum = 1; // 数据开始的行号

        try {
            // 按批次写入数据
            for (int i = 0; i < totalRows / batchSize; i++) {
                // 模拟获取每批数据
                List<Data> dataList = getDataBatch(rowNum, batchSize);
                
                // 将数据写入到Excel中
                for (Data data : dataList) {
                    Row row = sheet.createRow(rowNum++);
                    row.createCell(0).setCellValue(data.getId());
                    row.createCell(1).setCellValue(data.getName());
                    row.createCell(2).setCellValue(data.getAge());
                }

                // 处理完成一批数据后，可以选择清除缓存数据，防止内存溢出
                ((SXSSFSheet) sheet).flushRows(batchSize); // 清除已写的行缓存
            }

            // 将数据写入文件
            try (FileOutputStream fos = new FileOutputStream(filePath)) {
                workbook.write(fos);
            }
            System.out.println("数据导出完成：" + filePath);

        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            // 关闭workbook并删除临时文件
            workbook.dispose();
        }
    }

    /**
     * 模拟分页获取数据
     */
    private static List<Data> getDataBatch(int startId, int batchSize) {
        List<Data> dataList = new ArrayList<>(batchSize);
        for (int i = 0; i < batchSize; i++) {
            dataList.add(new Data(startId + i, "Name" + (startId + i), 20 + (startId + i) % 50));
        }
        return dataList;
    }

    // 数据类
    static class Data {
        private final int id;
        private final String name;
        private final int age;

        public Data(int id, String name, int age) {
            this.id = id;
            this.name = name;
            this.age = age;
        }

        public int getId() {
            return id;
        }

        public String getName() {
            return name;
        }

        public int getAge() {
            return age;
        }
    }
}

来解释一下代码

SXSSFWorkbook：SXSSFWorkbook(100)表示内存中最多保留100行数据，超过的部分会写入临时文件，节省内存。
批次处理：通过batchSize控制每批次写入的数据量，以减少内存消耗。totalRows设置为1,000,000表示导出100万条数据。
模拟数据生成：getDataBatch方法模拟分页获取数据，每次返回一批数据。
清除缓存行：每次写入一批数据后，通过flushRows(batchSize)将缓存的行从内存中清除，以控制内存占用。
压缩临时文件：workbook.setCompressTempFiles(true)启用临时文件压缩，进一步减少磁盘空间占用。

需要注意的事项

临时文件：SXSSFWorkbook会在系统临时文件夹中生成临时文件，需要确保磁盘空间足够。
资源释放：完成数据写入后需要调用workbook.dispose()以清理临时文件。
性能优化：可根据机器内存调整batchSize和SXSSFWorkbook缓存行数，避免频繁刷新和内存溢出。

作为程序员，持续学习和充电非常重要，作为开发者，我们需要保持好奇心和学习热情，不断探索新的技术，只有这样，我们才能在这个快速发展的时代中立于不败之地。低代码也是一个值得我们深入探索的领域，让我们拭目以待，它将给前端世界带来怎样的变革，推荐一个低代码工具。

应用地址：www.jnpfsoft.com
开发语言：Java/.net

这是一个基于Flowable引擎(支持java、.NET)，已支持MySQL、SqlServer、Oracle、PostgreSQL、DM（达梦）、 KingbaseES（人大金仓）6个数据库，支持私有化部署，前后端封装了上千个常用类，方便扩展，框架集成了表单、报表、图表、大屏等各种常用的 Demo 方便直接使用。

至少包含表单建模、流程设计、报表可视化、代码生成器、系统管理、前端 UI 等组件，这种情况下我们避免了重复造轮子，已内置大量的成熟组件，选择合适的组件进行集成或二次开发复杂功能，即可自主开发一个属于自己的应用系统。

原文地址：https://blog.csdn.net/Andrew_Chenwq/article/details/143471401

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：C++算法练习-day42——98.验证二叉搜索树
下一篇：vue 录音流程

网络安全之信息收集-实战-2
信息收集是渗透测试的基础，通过系统地收集和分析目标信息，可以大大提高测试的效率和成功率。希望本文能帮助读者掌握信息收集的基本方法和工具，为后续的渗透测试打下坚实的基础。
阅读更多2024-11-23
linux上安装docker
在 Linux 上安装 Docker 是一个相对简单的过程。以下是针对 Debian 和其他基于 Debian 的发行版（如 Ubuntu）的详细步骤。如果您使用的是其他发行版（如 CentOS 或
阅读更多2024-11-23
事务详解（特性）
事务是一个逻辑工作单元，它包含了一组数据库操作，这些操作要么全部成功执行，要么全部回滚，就好像这些操作从未发生过一样。例如，在银行转账的场景中，从一个账户扣除金额并向另一个账户增加金额这两个操作必须作
阅读更多2024-11-23
前端面试题25 | 你怎么理解JavaScript中的mixins？
JavaScript中的mixins？
阅读更多2024-11-23
Springboot整合jodconverter调用LibreOffice/OpenOffice
【代码】Springboot整合jodconverter调用LibreOffice/OpenOffice。
阅读更多2024-11-23
【数据结构】【线性表】【练习】反转链表
有聪明的同学已经想到，那么我加一个指针cur，在p改变next之前，cur先行一步，到达下一个结点，等p改完next再跟上cur不就可以了？给你单链表的头指针head以及两个整数left和right，
阅读更多2024-11-23
【Linux】进程程序替换
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序
阅读更多2024-11-23
Mysql数据库SQL语句执行日志
mysql查看sql语句的执行情况2. 通用查询日志查看状态和路径：动态开启：动态关闭：3. 慢查询日志查看状态、路径和慢查询阈值：动态开启：动态关闭：4. 二进制日志查看状态和配置：二进制日志无法通
阅读更多2024-11-23
RocketMQ学习记录
RocketMQ学习记录
阅读更多2024-11-23
深度解析 Java 中的异常机制：从基础到实践
异常是程序运行时出现的非预期情况，可能导致程序无法继续正常执行。例如，除以零、访问数组越界或读取一个不存在的文件等。Java 使用异常类（Exception）来表示这些问题，并提供了一套完整的机制来捕
阅读更多2024-11-23

如何解决Java EasyExcel 导出报内存溢出