第四篇:java读取Excel简单模板

场景:对于经常需要导入Excel模板或数据来解析后加以应用的,使用频率非常之高,做了一个比较稳定的版本,体现在这些地方
工具:org.apache.poi
使用前必须了解这些:
1、要解析,那肯定先判断是不是Excel
2、xls后缀的Excel,是03版及以前的用HSSFWorkbook类
      xlsx后缀的Excel,是07版及以后的用XSSFWorkbook解析
3、getWorkbook这个方法是我自己乱造各种Excel数据不断测试搜索修正得出的结果,
其他的像简单的判断后缀xls还是xlsx来决定用HSSH还是XSSF是不保险的,比如你可能没遇到过org.apache.poi.openxml4j.exceptions.InvalidFormatException这样的异常,
当然这个异常仍然是因为Excel类型导致获取workbook时出错,然而我查到的结果是,Excel最底层是xml实现的,类型问题出在这儿,看异常的描述也可以稍微看出来openxml4j.exceptions
4 、可能出现空行,空的单元格,或者单元格值为空的情况,这些情况,在我的readExcel()方法里都考虑到了,为什么我不用迭代器,或者加强的for each循环?就是因为这些坑爹的空单元格或者空行啊,迭代器内部在取cell单元格对象时跳过这些空的对象,who knows why?我也不知道,反正我测试过,跳过去了,本来5个单元格,一个空的,结果就只得到4个数据,即使用cell.isEmpty()和cell!=null来判断,也没卵用,因为遍历的时候直接跳过去了,都没有判断的机会
5、取单元格数据,这个就比较简单了,判断单元格类型,根据类型做相应的处理取出来,但是我觉得我这个getCellValue()的方法应该有漏洞,先这么用着 
下面上代码,简单描述下关键部位

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;
import java.io.PushbackInputStream;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;
import java.util.List;
import org.apache.poi.POIXMLDocument;
import org.apache.poi.openxml4j.exceptions.InvalidFormatException;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.apache.poi.hssf.usermodel.HSSFCell;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.xmlbeans.impl.piccolo.io.FileFormatException;
/**
 *yanbiao 2016.10.25 
 */
public class ExcelUtil {
 
    private static final String EXTENSION_XLS = "xls";
    private static final String EXTENSION_XLSX = "xlsx";

/**
* 文件检查
*/
private void preReadCheck(String filePath) throws FileNotFoundException, FileFormatException {

File file = new File(filePath);
if (!file.exists()) {
throw new FileNotFoundException("导入的文件不存在:" + filePath);
}
if (!(filePath.endsWith(EXTENSION_XLS) || filePath.endsWith(EXTENSION_XLSX))) {
throw new FileFormatException("传入的文件不是excel");
}
} 
 /**
     * 取得WorkBook对象
     * xls:HSSFWorkbook,03版
     * xlsx:XSSFWorkbook,07版
    */
 private Workbook getWorkbook(String filePath) throws IOException, InvalidFormatException {  
        //直接判断后缀来返回相应的Workbook对象多数情况没问题,但是这个更保险,第3条已经说明   
        Workbook wb = null;
        InputStream is = new FileInputStream(filePath);
        if (!is.markSupported()) {
            is = new PushbackInputStream(is, 8);
        }
        if (POIFSFileSystem.hasPOIFSHeader(is)) {
             return new HSSFWorkbook(is);
        }
        if (POIXMLDocument.hasOOXMLHeader(is)) {
            return new XSSFWorkbook(OPCPackage.open(is));
        }
        throw new IllegalArgumentException("您的excel版本目前不支持poi解析");
    }
  
    /**
     * 读取excel文件内容
     */
    public Map<Integer, List<String>> readExcel(String filePath) throws FileNotFoundException, FileFormatException {
        // 检查和获取workbook对象
        this.preReadCheck(filePath);
        Workbook wb = null;
        Map<Integer,List<String>> map = new HashMap<Integer, List<String>>();
        try {
            wb = this.getWorkbook(filePath);
            // 默认只读取第一个sheet  
            Sheet sheet = wb.getSheetAt(0);
            int rowcount = sheet.getLastRowNum();//逻辑行,包括空行
            int cellcount = sheet.getRow(0).getLastCellNum();//第一行(将来作为字段的行)有多少个单元格
            for (int i=0;i<rowcount;i++) {                    //这里用最原始的for循环来保证每行都会被读取
                  List<String> list = new ArrayList<String>();
                  Row row = sheet.getRow(i);
                  if(null!=row){
                       for (int j=0;j<cellcount;j++) {
                          list.add(getCellValue(row.getCell(j)));   //这里也是用for循环,用Cell c:row这样的遍历,空单元格就被抛弃了   
                        }
                       System.out.println("第"+(row.getRowNum()+1)+"行数据:"+list.toString());
                       map.put(row.getRowNum(), list);  
                   }else{
                       for (int j=0;j<cellcount;j++) {
                            list.add("无数据");      
                        }
                        System.out.println("第"+(i+1)+"行数据:"+list.toString());
                        map.put(i, list);
               }         
            }        
        } catch (Exception e) {
               System.out.println("读取Excel异常:"+e.getMessage());
                e.printStackTrace();
           } finally {
                 if (wb != null) {
                      try {
                              wb.close();
                       } catch (IOException e) {
                              e.printStackTrace();
                          }
                 }
              }
        return map;     
    }
    /**
     * 取单元格的值
     */
    private String getCellValue(Cell c) {
        if (c == null) {
            return "无数据";
        }
        String value = "";
        switch (c.getCellType()){
        case HSSFCell.CELL_TYPE_NUMERIC://数字
             value = c.getNumericCellValue()+"";
        break;
        case HSSFCell.CELL_TYPE_STRING://字符串
            value = c.getStringCellValue();
        break;
        case HSSFCell.CELL_TYPE_BOOLEAN://boolean
            value = c.getBooleanCellValue()+"";
        break;
        case HSSFCell.CELL_TYPE_FORMULA://公式
            value = c.getCellFormula()+"";
        break;
        case HSSFCell.CELL_TYPE_BLANK://空值
            value= "无数据";
         break;
        case HSSFCell.CELL_TYPE_ERROR:
            value = "非法字符";
         break;
        default:
            value= "未知类型";
         break;        
        }
        return value;
    }
}



猜你喜欢

转载自www.cnblogs.com/yb38156/p/9821804.html