热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

javapoi解析word的方法

这篇文章主要为大家详细介绍了javapoi解析word的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

之前做过用java读取word文档,获取word文本内容。

但发现docx的支持,doc就异常了。

后来找了很多资料发现是解析方法不一样。

首先要导入poi相关的jar包

我用的是maven,pom.xml引入如下:


      org.apache.poi
      poi-ooxml
      3.8
    
    
      org.apache.poi
      poi-scratchpad
      3.8
    

java获取word文本内容如下:

public BaseResp getParsedTxt(MultipartFile file) throws Exception {
    BaseResp br=new BaseResp("200","") ;
    String textType = file.getContentType();
    String txt = "";
    if(textType.equals(TXT_TYPE)){
      String code = getCharset(file);
      txt = new String(file.getBytes(),code);
    }else if(textType.equals(DOC_TYPE)){
      HWPFDocument doc = new HWPFDocument(file.getInputStream());
      Range rang = doc.getRange();
      txt = rang.text();
      System.out.println(txt);
    }else if(textType.equals(DOCX_TYPE)){
      File uFile = new File("tempFile.docx");
      if(!uFile.exists()){
        uFile.createNewFile();
      }
      FileCopyUtils.copy(file.getBytes(), uFile);
      OPCPackage opcPackage = POIXMLDocument.openPackage("tempFile.docx");
      POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);
      txt= extractor.getText();
      uFile.delete();
    }else{
      br = new BaseResp("300","上传文件格式错误,请上传.txt或者.docx");
      return br;
    }
    br.setDatas(txt);
    return br;
  }

功能实现了。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。


推荐阅读
author-avatar
书友49916066
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有