作者:手机用户2502904705 | 来源:互联网 | 2023-10-12 17:22
场景介绍
因为一直在使用阿里的EasyExcel也挺方便的,而且性能也是非常不错,但是有些场景还是不支持,比如说读取excel中的指定行指定列的图片信息。
毕竟Apache的POI还是比较强大,对于一些图片的处理不管是word和PDF还有他们之间的相互转换都有相应的API支持。
tips:小技巧
我这里主要是想分享一下在处理excel图片的过程中所遇到的一些小问题。
- excel中的图片和文字等并不是统一处理的,而是分开的。
- 普通的文字内容能通过行列号直接能准确的定位到,图片则“不能”,为啥会主动加上引号,因为图片的位置跟他在的单元格有绝对的关系,是有边界的。下文会验证这点。
- 假如现在的需求是处理每一行的excel内容,并要求把图片也入库,则需要分开处理图片和别的列的内容。
实验环境
POI指定版本如下:
org.apache.poipoi-ooxml3.17
JDK版本:1.8
所用的excel文件如下图:
现在接下来就是通过POI读取到两张图片资源,并打印相应的行号和列号。
public static void main(String[] args) {// 文件路径可以根据自己需求来 我的是放在本地根路径下了File file = new File("static/image/导入图片.xlsx");XSSFWorkbook wb = null;try {wb = new XSSFWorkbook(file);} catch (IOException | InvalidFormatException e) {e.printStackTrace();}XSSFSheet sheet = wb.getSheetAt(0);List list = sheet.getRelations();for (POIXMLDocumentPart part : list) {if (part instanceof XSSFDrawing) {XSSFDrawing drawing = (XSSFDrawing) part;List shapes = drawing.getShapes();for (XSSFShape shape : shapes) {XSSFPicture picture = (XSSFPicture) shape;PictureData pic = picture.getPictureData();XSSFClientAnchor anchor = picture.getPreferredSize();CTMarker marker = anchor.getFrom();// 获取图片格式String ext = pic.suggestFileExtension();log.info("行号[{}],单元格[{}],图片格式[{}]", marker.getRow(), marker.getCol(), ext);}}}}
以上代码也很简单,直接就能跑起来,如果按照上面excel的图片文件位置,读取出来的图片坐标也符合预期,结果如下:
但是如果把图片放置的单元格稍微拖动一下,改成这样的:不仔细看或者运营人员稍微处理不当,两个单元格出现相互覆盖的情况,读取入库可能就出现错位了。
实验结果也正是如此:
类似的如果是图片横向的覆盖左边的单元格,图片的坐标也是就近原则。效果如下:
实验结果如下:
总结:
最后我总结下:如果需求中有了类似的场景需要用到excel处理图片,并且还需要入库,数据库最好是存储图片资源的路径,次之可以把图片转成Base64也可行。
我比较推荐第一种,可以单独开一个线程来异步处理类似这样的导入导出任务,慢一点也无所谓,或者定时任务也行。
在保证图片没有错位的前提下,读取到图片后,提前先把图片上传到指定的服务器(有CDN更好)返回图片所在的行号和列号和图片资源URL,然后在读取每一行excel根据行号判断该行对应的图片资源是哪一列,把资源路径设置好,这里可以稍微处理下,如果该图片是在前端后期直接在页面上渲染,可对该资源URL加上标签。比如:
String.format("