百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

Java使用poi进行excel的导入操作

toyiye 2024-06-21 12:18 9 浏览 0 评论

创建项目测试

1 创建springBoot项目

2 pom导入相关依赖

xml复制代码 <!--导入依赖jar包-->

 <!--xls(03)-->

<dependency>

    <groupId>org.apache.poi</groupId>

    <artifactId>poi</artifactId>

    <version>3.9</version>

</dependency>



 <!--xlsx(07)-->

<dependency>

    <groupId>org.apache.poi</groupId>

    <artifactId>poi-ooxml</artifactId>

    <version>3.9</version>

</dependency>



 <!--日期格式化工具-->

<dependency>

    <groupId>joda-time</groupId>

    <artifactId>joda-time</artifactId>

    <version>2.10.1</version>

</dependency>



 <!--单元测试-->

<dependency>

    <groupId>junit</groupId>

    <artifactId>junit</artifactId>

    <version>4.12</version>

</dependency>

本地创建两个excel 分别是03版和07版

首先03版,它最多有65536行

但是07版的,是没有限制的

他们对应的后缀也是不一样的,03版本的xls,07版本的是xslx,这意味着操作它们的工具类也不相同.03版本用的是poi,07版用的则是poi-ooxml

4 Java的宗旨就是万物皆对象,我们也要把excel当成我们的一个对象去处理

1 工作薄

首先我们打开的excel就是一个大对象,也叫工作簿,它包括以下内容

2 工作表

每一个sheet也是我们excel对象的属性,也叫工作表,我们肯定是现有工作簿才会有工作表,而且会默认自带sheet,也可以根据我们的需要自行添加sheet工作表

3 行

excel中有很多行,每一行也是我们excel对象的属性(横的叫行,竖的叫列)

4 列

excel中有很多列,每一列也是我们excel对象的属性(横的叫行,竖的叫列)

5 单元格

一行一列有很多个单元格,每一个单元格也是我们excel对象的属性

创建我们的测试类,创建Workbook对象,按着ctrl点进去发现它是一个接口

点击箭头可以看到它的三个实现类

定义工作簿,工作表,行列,单元格,和我们手动创建excel是一样的操作,只不过是用代码来实现

03版本excel IO操作写的全部代码如下

java复制代码package com.wyh.Test;



import org.apache.poi.hssf.usermodel.HSSFSheet;

import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.joda.time.DateTime;

import org.junit.Test;



import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.util.Date;



 /**

 *  @program:  JavaExecl

 *  @description:  写excel 03版本

 *  @author:  魏一鹤

 *  @createDate:  2021-12-12 10:42

 **/



public class ExcelWrite03 {

    //全局路径,供我们操作使用方便

  static String path= "D:\Tools\JavaWorkSpace\JavaExecl\" ;

    @Test

    public  void ExcelWrite03() throws Exception {

        //1创建一个工作簿

 Workbook workbook=new HSSFWorkbook();

        //2创建一个工作表 工作簿里面包含工作表,所以创建工作表要通过工作簿创建

 //默认的工作表是没有名字的,需要我们手动赋值,和我们在excel中更改sheet工作表的名称是一样的 操作

 Sheet sheet=workbook.createSheet( "用户表" );

        //3创建行 行也是在我们的表中存在的,所以需要用到表来创建

 //默认从0开始 也就是第一行

 Row row1 = sheet.createRow(0);

        //创建单元格 第一行的第一个数据 用坐标表示为(1,1)

 Cell cell11 = row1.createCell(0);

        //创建单元格 第一行的第二个数据 用坐标表示为(1,2)

 Cell cell12 = row1.createCell(1);

        //给单元格赋值

 cell11.setCellValue( "姓名" );

        cell12.setCellValue( "魏一鹤" );

        //创建第二行

 Row row2=sheet.createRow(1);

        //创建第二行的第一列

 Cell cell21 = row2.createCell(0);

        Cell cell22 = row2.createCell(1);

        //给单元格赋值(2.1)

 cell21.setCellValue( "出生日期" );

        //创建时间并且格式化

 String s = new DateTime().toString( "yyyy-MM-dd HH:mm:ss" );

        //给单元格赋值(2.2)

 cell22.setCellValue(s);

        //生成一张表 其实就是IO流操作 03版本就是使用xls文件结尾

 FileOutputStream fileOutputStream = new FileOutputStream(path + "用户测试03.xls" );

        //输出工作簿

 workbook.write(fileOutputStream);

        //关闭流

 fileOutputStream.close();

        System.out.println( "用户测试03.xls生成完毕" );

    }

}

07版本excel IO操作写的全部代码如下

less复制代码package com.wyh.Test;



import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.apache.poi.xssf.usermodel.XSSFWorkbook;

import org.joda.time.DateTime;

import org.junit.Test;



import java.io.FileOutputStream;



 /**

 *  @program:  JavaExecl

 *  @description:  07版本excel写操作

 *  @author:  魏一鹤

 *  @createDate:  2021-12-12 23:58

 **/



public class ExcelWrite07 {

    //全局路径,供我们操作使用方便

  static String path= "D:\Tools\JavaWorkSpace\JavaExecl\" ;

    @Test

    public  void ExcelWrite07() throws Exception {

        //07版和03最大的差别就是使用的工具不一样 03是HSSF 07是XSSF

 //其他代码无需改动

 //1创建一个工作簿

 Workbook workbook=new XSSFWorkbook();

        //2创建一个工作表 工作簿里面包含工作表,所以创建工作表要通过工作簿创建

 //默认的工作表是没有名字的,需要我们手动赋值,和我们在excel中更改sheet工作表的名称是一样的 操作

 Sheet sheet=workbook.createSheet( "用户表" );

        //3创建行 行也是在我们的表中存在的,所以需要用到表来创建

 //默认从0开始 也就是第一行

 Row row1 = sheet.createRow(0);

        //创建单元格 第一行的第一个数据 用坐标表示为(1,1)

 Cell cell11 = row1.createCell(0);

        //创建单元格 第一行的第二个数据 用坐标表示为(1,2)

 Cell cell12 = row1.createCell(1);

        //给单元格赋值

 cell11.setCellValue( "今日学习" );

        cell12.setCellValue( "api和easyExcl导出导入excel" );

        //创建第二行

 Row row2=sheet.createRow(1);

        //创建第二行的第一列

 Cell cell21 = row2.createCell(0);

        Cell cell22 = row2.createCell(1);

        //给单元格赋值(2.1)

 cell21.setCellValue( "学习日期" );

        //创建时间并且格式化

 String s = new DateTime().toString( "yyyy-MM-dd HH:mm:ss" );

        //给单元格赋值(2.2)

 cell22.setCellValue(s);

        //生成一张表 其实就是IO流操作 07版本就是使用xlsx文件结尾

 FileOutputStream fileOutputStream = new FileOutputStream(path + "用户测试07.xlsx" );

        //输出工作簿

 workbook.write(fileOutputStream);

        //关闭流

 fileOutputStream.close();

        System.out.println( "用户测试07.xls生成完毕" );

    }

}

运行后发现,会在项目本地生成我们定义的excel,打开查看

03版和07版的区别如下

1 03版本有最大长度现在 07版本没有

2 03版本后缀xls 07版本后缀xlsx

3 03版本使用的工具是HSSF,07版本使用的是XSSF

5 大数据绕导入导出(批量)

真实开发中,大多数就是大数据批量导入或者导出excel

大文件写HSSF

缺点:最多只能处理65536行,否则会报内存溢出异常

优点:过程中写入缓存,不操作磁盘,最后一次性写入磁盘,速度快

大文件写XSSF

缺点:写数据时速度非常慢,非常消耗内存,也会发生内存溢出,比如100万条

优点:可以写较大的数据量,比如20万条

03版本HSSF循环导入65536行数据(03版本最大行就是65536)

03版本HSSF循环插入65536条

java复制代码

package com.wyh.Test;



import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.junit.Test;



import java.io.FileOutputStream;



 /**

 *  @program:  JavaExecl

 *  @description:  大数据量写03版本

 *  @author:  魏一鹤

 *  @createDate:  2021-12-14 23:31

 **/



public class BigDateExcelWrite03 {

    //全局路径,供我们操作使用方便

  static String path = "D:\Tools\JavaWorkSpace\JavaExecl\" ;



    @Test

    public void BigDateExcelWrite03() throws Exception {

        //开始时间 用于计算时间差

  long beginTime = System.currentTimeMillis();

        //创建工作簿  03版本使用HSSF

 Workbook workbook = new HSSFWorkbook();

        //创建工作表 这里就不给它命令了 按照默认的来

 Sheet sheet = workbook.createSheet();

        //写入数据 循环插入65536行数据,03版的HSSF最多只能插入65536行

  for (int rowNum = 0; rowNum < 65536; rowNum++) {

            //循环创建行

 Row row = sheet.createRow(rowNum);

            for(int cellNum=0;cellNum<10;cellNum++){

                //循环插入列

 Cell cell = row.createCell(cellNum);

                //循环设置值

 cell.setCellValue(cellNum);

            }

        }

        System.out.println( "生成excel表完毕" );

        //03版本的后缀是xls

 //开启文件流

 FileOutputStream fileOutputStream = new FileOutputStream(path + "BigDateExcelWrite03.xlsx" );

        //开始写excel

 workbook.write(fileOutputStream);

        //关闭流

 fileOutputStream.close();

        //结束时间

  long endTime = System.currentTimeMillis();

        //输出花费的时间

 System.out.println( "花费的时间:" +(double)(endTime - beginTime)/1000);

    }

}

运行发现excel已经创建成功,速度也非常的快

打开查看

已知03版本xls最多存65536行,那么如果我们循环插入65537行会怎么样呢? 保留源代码,循环最大值设置为65537

再次运行发现会报错

java复制代码java.lang.IllegalArgumentException: Invalid row number (65536) outside allowable range (0..65535)

07版本XSSF循环插入65536条

把后缀改为xlsx,把HSSF缓存XSSF即可

java复制代码

package com.wyh.Test;



import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.apache.poi.xssf.usermodel.XSSFWorkbook;

import org.junit.Test;



import java.io.FileOutputStream;



 /**

 *  @program:  JavaExecl

 *  @description:  大数据量写03版本

 *  @author:  魏一鹤

 *  @createDate:  2021-12-14 23:31

 **/



public class BigDateExcelWrite07 {

    //全局路径,供我们操作使用方便

  static String path = "D:\Tools\JavaWorkSpace\JavaExecl\" ;



    @Test

    public void BigDateExcelWrite07() throws Exception {

        //开始时间 用于计算时间差

  long beginTime = System.currentTimeMillis();

        //创建工作簿 07版本的使用XSSF

 Workbook workbook = new XSSFWorkbook();

        //创建工作表 这里就不给它命令了 按照默认的来

 Sheet sheet = workbook.createSheet();

        //写入数据 循环插入65536行数据,03版的HSSF最多只能插入65536行

  for (int rowNum = 0; rowNum < 65536; rowNum++) {

            //循环创建行

 Row row = sheet.createRow(rowNum);

            for(int cellNum=0;cellNum<10;cellNum++){

                //循环插入列

 Cell cell = row.createCell(cellNum);

                //循环设置值

 cell.setCellValue(cellNum);

            }

        }

        System.out.println( "生成excel表完毕" );

        //037版本的后缀是xlsx

 //开启文件流

 FileOutputStream fileOutputStream = new FileOutputStream(path + "BigDateExcelWrite07.xlsx" );

        //开始写excel

 workbook.write(fileOutputStream);

        //关闭流

 fileOutputStream.close();

        //结束时间

  long endTime = System.currentTimeMillis();

        //输出花费的时间

 System.out.println( "花费的时间:" +(double)(endTime - beginTime)/1000);

    }

}

虽然也运行成功,但是可以明显感觉到速度不如03版HSSF,但是可以存更多的数据

打开excel查看发现数据到了65536停并没有结束,说明07版本XSSF上限不是65536,是可以存储更多的,可以写更多的数据

如果我们正在查看同一个文件,但是又进行其他操作,就会出现以下错误,我们把我们正在查看的文件关闭让它运行,等运行结束后再次打开即可

lua复制代码java.io.FileNotFoundException: D:\Tools\JavaWorkSpace\JavaExecl\BigDateExcelWrite07.xlsx (另一个程序正在使用此文件,进程无法访问。)

07版本XSSF导入100000条数据,把循环数改为100000即可

既然XSSF可以存这么多数据,但是速度比较慢,有没有方法可以优化效率呢(缓存,这个问题也可以叫做如何给poi加速

它就是Workbook借口三个实现类之一的SXSSFWorkbook,其他的两个我们上面都有操作过

这时候需要用到我们的SXSSF

优点:可以写非常大的数据量.如100万条甚至更多,写速度非常快,占用更少的

注意

1 过程中会产生临时文件,需要清理临时文件

2 默认由100条记录被保存在内存中,如果超过这数量,则最前面的数据被写入临时文件,当然缓存数量也可以自定义

3 如果自定义内存中数据的数量,可以使用new SXSSFWorkbook(数量)

SXSSF循环插入100000条数据

java复制代码

package com.wyh.Test;



import org.apache.poi.ss.usermodel.Cell;

import org.apache.poi.ss.usermodel.Row;

import org.apache.poi.ss.usermodel.Sheet;

import org.apache.poi.ss.usermodel.Workbook;

import org.apache.poi.xssf.streaming.SXSSFWorkbook;

import org.apache.poi.xssf.usermodel.XSSFWorkbook;

import org.junit.Test;



import java.io.FileOutputStream;



 /**

 *  @program:  JavaExecl

 *  @description:  大数据量写03版本

 *  @author:  魏一鹤

 *  @createDate:  2021-12-14 23:31

 **/



public class BigDateExcelWrite07Super {

    //全局路径,供我们操作使用方便

  static String path = "D:\Tools\JavaWorkSpace\JavaExecl\" ;



    @Test

    public void BigDateExcelWrite07Super() throws Exception {

        //开始时间 用于计算时间差

  long beginTime = System.currentTimeMillis();

        //创建工作簿 07版本的使用XSSF

 Workbook workbook = new SXSSFWorkbook();

        //创建工作表 这里就不给它命令了 按照默认的来

 Sheet sheet = workbook.createSheet();

        //写入数据 循环插入65536行数据,03版的HSSF最多只能插入65536行

  for (int rowNum = 0; rowNum < 100000; rowNum++) {

            //循环创建行

 Row row = sheet.createRow(rowNum);

            for(int cellNum=0;cellNum<10;cellNum++){

                //循环插入列

 Cell cell = row.createCell(cellNum);

                //循环设置值

 cell.setCellValue(cellNum);

            }

        }

        System.out.println( "生成excel表完毕" );

        //037版本的后缀是xlsx

 //开启文件流

 FileOutputStream fileOutputStream = new FileOutputStream(path + "BigDateExcelWrite07Super.xlsx" );

        //开始写excel

 workbook.write(fileOutputStream);

        //关闭流

 fileOutputStream.close();

        //由于SXSSF会产生临时文件,这里我们需要清除下临时文件

 ((SXSSFWorkbook) workbook).dispose();

        //结束时间

  long endTime = System.currentTimeMillis();

        //输出花费的时间

 System.out.println( "花费的时间:" +(double)(endTime - beginTime)/1000);

    }

}

运行发现,excel也正常生成了,但是它(SXSSF)的速度比XSSF快的多

查看我们的super

这就是我们的临时文件,随着我们把文件的关闭,临时文件也会随之消失

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码