JAVA POI实现大数据量excel文件读写及导出

createh53个月前 (02-01)技术教程25


Apache POI 是一个流行的 Java 库,用于处理 Microsoft Office 文档,包括 Excel。处理大数据量的 Excel 文件时,建议使用 SXSSF (Streaming Usermodel API) 来写数据,因为它可以有效地处理大量数据而不会耗尽内存。

以下是一个简单的示例,展示如何使用 Apache POI 读写大数据量的 Excel 文件,并导出数据:

  1. 添加依赖

首先,确保你的项目中包含了 Apache POI 的依赖。如果你使用 Maven,可以在 pom.xml 中添加以下依赖:

<dependency>  
    <groupId>org.apache.poi</groupId>  
    <artifactId>poi-ooxml</artifactId>  
    <version>5.0.0</version> <!-- 请检查是否有更新的版本 -->  
</dependency>
  1. 读取大数据量的 Excel 文件
public void readLargeExcelFile(String filePath) throws IOException {  
    InputStream is = new FileInputStream(filePath);  
    Workbook workbook = WorkbookFactory.create(is);  
    Sheet sheet = workbook.getSheetAt(0);  
    Iterator<Row> rowIterator = sheet.iterator();  
  
    while (rowIterator.hasNext()) {  
        Row row = rowIterator.next();  
        Iterator<Cell> cellIterator = row.cellIterator();  
  
        while (cellIterator.hasNext()) {  
            Cell cell = cellIterator.next();  
            switch (cell.getCellType()) {  
                case STRING:  
                    System.out.print(cell.getStringCellValue() + "\t");  
                    break;  
                case NUMERIC:  
                    System.out.print(cell.getNumericCellValue() + "\t");  
                    break;  
                // 其他数据类型可以按需处理  
            }  
        }  
        System.out.println("");  
    }  
    workbook.close();  
    is.close();  
}
  1. 写入大数据量的 Excel 文件

使用 SXSSF 来处理大数据量的写入:

public void writeLargeExcelFile(String filePath) throws IOException {  
    Workbook workbook = new SXSSFWorkbook(); // 使用 SXSSF 处理大数据量写入  
    Sheet sheet = workbook.createSheet("Sheet1");  
    int rowCount = 0;  
  
    for (int i = 0; i < 100000; i++) { // 假设有100,000行数据  
        Row row = sheet.createRow(rowCount++);  
        for (int j = 0; j < 10; j++) { // 假设每行有10个单元格  
            Cell cell = row.createCell(j);  
            cell.setCellValue("Data" + i + j);  
        }  
        // 控制内存使用,告诉 SXSSF 在达到一定的行数后刷新到磁盘,释放内存中的行数据  
        if (rowCount % 100 == 0) {  
            ((SXSSFSheet) sheet).flushRows(100); // 保留最后100行在内存中,其他的刷新到磁盘  
        }  
    }  
    FileOutputStream outputStream = new FileOutputStream(filePath);  
    workbook.write(outputStream);  
    workbook.close();  
    outputStream.close();  
}

注意:当处理大数据量的 Excel 文件时,要确保调整 JVM 的内存设置,以提供足够的内存来处理数据。

相关文章

「Java进阶」I/O操作必备知识点:字节流读写实例讲解

序欢迎来到全网最完整的Java进阶知识系列教程!!!每天定时更新!!!本期的课程,我们继续分享I/O文件读写。IO文件读写,根据数据格式不同,分为字节流读写和字符流读写,我们今天先讲字节流读写。如果你...

java入门教程1 - 安装和配置(win和linux)

windows安装和配置安装javahttps://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.html目前大部分项目的...

2020-12-11:多个线程同时写同一个日志文件,为...

2020-12-11:多个线程同时写同一个日志文件,为什么相互写的内容不会被覆盖?福哥答案2020-12-11:[答案来自此链接:](https://bbs.csdn.net/topics/39851...

这份日志格式规范超棒的,拿走不谢(Java版)

1 简介在程序中写日志是一件非常重要,但是很容易被开发人员忽视的地方。写好程序的日志可以帮助我们大大减轻后期维护压力。在实际的工作中,开发人员往往迫于巨大时间压力,而写日志又是一个非常繁琐的事情,往往...

零拷贝技术及在Java中应用(零拷贝技术是什么)

前言前一段时间参与定位Tomcat某一问题,涉及到sendfile系统调用。忽然想到之前一些使用经验,知道Java领域中有不少开源软件,都使用零拷贝来提升期性能,于是有了本文。先看看我们这些耳熟能详的...