热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

POI读取excel图片并定位图片需要提前注意的事项

场景介绍因为一直在使用阿里的EasyExcel也挺方便的,而且性能也是非常不错,但是有些场景还是不支持,比如说读取excel中的指定行指

场景介绍

因为一直在使用阿里的EasyExcel也挺方便的,而且性能也是非常不错,但是有些场景还是不支持,比如说读取excel中的指定行指定列的图片信息。

毕竟Apache的POI还是比较强大,对于一些图片的处理不管是word和PDF还有他们之间的相互转换都有相应的API支持。


tips:小技巧

我这里主要是想分享一下在处理excel图片的过程中所遇到的一些小问题。


  1. excel中的图片和文字等并不是统一处理的,而是分开的。
  2. 普通的文字内容能通过行列号直接能准确的定位到,图片则“不能”,为啥会主动加上引号,因为图片的位置跟他在的单元格有绝对的关系,是有边界的。下文会验证这点。
  3. 假如现在的需求是处理每一行的excel内容,并要求把图片也入库,则需要分开处理图片和别的列的内容。

实验环境

POI指定版本如下:

org.apache.poipoi-ooxml3.17

JDK版本:1.8

所用的excel文件如下图:

现在接下来就是通过POI读取到两张图片资源,并打印相应的行号和列号。

public static void main(String[] args) {// 文件路径可以根据自己需求来 我的是放在本地根路径下了File file = new File("static/image/导入图片.xlsx");XSSFWorkbook wb = null;try {wb = new XSSFWorkbook(file);} catch (IOException | InvalidFormatException e) {e.printStackTrace();}XSSFSheet sheet = wb.getSheetAt(0);List

list = sheet.getRelations();for (POIXMLDocumentPart part : list) {if (part instanceof XSSFDrawing) {XSSFDrawing drawing = (XSSFDrawing) part;List shapes = drawing.getShapes();for (XSSFShape shape : shapes) {XSSFPicture picture = (XSSFPicture) shape;PictureData pic = picture.getPictureData();XSSFClientAnchor anchor = picture.getPreferredSize();CTMarker marker = anchor.getFrom();// 获取图片格式String ext = pic.suggestFileExtension();log.info("行号[{}],单元格[{}],图片格式[{}]", marker.getRow(), marker.getCol(), ext);}}}}

以上代码也很简单,直接就能跑起来,如果按照上面excel的图片文件位置,读取出来的图片坐标也符合预期,结果如下:

但是如果把图片放置的单元格稍微拖动一下,改成这样的:不仔细看或者运营人员稍微处理不当,两个单元格出现相互覆盖的情况,读取入库可能就出现错位了。

实验结果也正是如此:

类似的如果是图片横向的覆盖左边的单元格,图片的坐标也是就近原则。效果如下:

实验结果如下:


总结:

最后我总结下:如果需求中有了类似的场景需要用到excel处理图片,并且还需要入库,数据库最好是存储图片资源的路径,次之可以把图片转成Base64也可行。

我比较推荐第一种,可以单独开一个线程来异步处理类似这样的导入导出任务,慢一点也无所谓,或者定时任务也行。

在保证图片没有错位的前提下,读取到图片后,提前先把图片上传到指定的服务器(有CDN更好)返回图片所在的行号和列号和图片资源URL,然后在读取每一行excel根据行号判断该行对应的图片资源是哪一列,把资源路径设置好,这里可以稍微处理下,如果该图片是在前端后期直接在页面上渲染,可对该资源URL加上标签。比如:

String.format("''

 


推荐阅读
  • 入门指南:使用FastRPC技术连接Qualcomm Hexagon DSP
    本文旨在为初学者提供关于如何使用FastRPC技术连接Qualcomm Hexagon DSP的基础知识。FastRPC技术允许开发者在本地客户端实现远程调用,从而简化Hexagon DSP的开发和调试过程。 ... [详细]
  • 小编给大家分享一下Vue3中如何提高开发效率,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获, ... [详细]
  • HTML:  将文件拖拽到此区域 ... [详细]
  • Ubuntu系统下的GIF动画录制解决方案
    在撰写文章或教程时,GIF动态图能够有效地传达信息。对于Windows用户而言,ScreenToGif是一款非常实用的工具。而在Ubuntu系统中,用户同样拥有多种选择来创建GIF动画,本文将重点介绍两款录屏工具——Byzanz和Peek。 ... [详细]
  • 本文探讨了如何利用RxJS库在AngularJS应用中实现对用户单击和拖动操作的精确区分,特别是在调整区域大小的场景下。 ... [详细]
  • 本文详细探讨了在Java中如何将图像对象转换为文件和字节数组(Byte[])的技术。虽然网络上存在大量相关资料,但实际操作时仍需注意细节。本文通过使用JMSL 4.0库中的图表对象作为示例,提供了一种实用的方法。 ... [详细]
  • 二维码的实现与应用
    本文介绍了二维码的基本概念、分类及其优缺点,并详细描述了如何使用Java编程语言结合第三方库(如ZXing和qrcode.jar)来实现二维码的生成与解析。 ... [详细]
  • 利用 Calcurse 在 Linux 终端高效管理日程与任务
    对于喜爱使用 Linux 终端进行日常操作的系统管理员来说,Calcurse 提供了一种强大的方式来管理日程安排、待办事项及会议。本文将详细介绍如何在 Linux 上安装和使用 Calcurse,帮助用户更有效地组织工作。 ... [详细]
  • Requests库的基本使用方法
    本文介绍了Python中Requests库的基础用法,包括如何安装、GET和POST请求的实现、如何处理Cookies和Headers,以及如何解析JSON响应。相比urllib库,Requests库提供了更为简洁高效的接口来处理HTTP请求。 ... [详细]
  • 本文总结了一次针对大厂Java研发岗位的面试经历,探讨了面试中常见的问题及其背后的原因,并分享了一些实用的面试准备资料。 ... [详细]
  • Jupyter Notebook多语言环境搭建指南
    本文详细介绍了如何在Linux环境下为Jupyter Notebook配置Python、Python3、R及Go四种编程语言的环境,包括必要的软件安装和配置步骤。 ... [详细]
  • 本文介绍了一种有效的方法来批量提取特定路径下所有文件的名称,包括步骤和命令行操作,适用于需要快速整理大量文件的场景。 ... [详细]
  • 如何高效解决Android应用ANR问题?
    本文介绍了ANR(应用程序无响应)的基本概念、常见原因及其解决方案,并提供了实用的工具和技巧帮助开发者快速定位和解决ANR问题,提高应用的用户体验。 ... [详细]
  • 云盒子更新:支持WPS、Visio和Project文档在线预览与图片导出
    企业云盘中的在线预览功能是提高工作效率的关键特性之一。借助云盒子提供的文件转换技术,用户可以无需安装额外软件,直接在线查看多种类型的文档,包括最新的WPS、Visio和Project文件。 ... [详细]
  • 解决Pytesser模块在Windows环境下出现的错误
    本文详细探讨了如何解决在Windows环境中使用Pytesser模块进行OCR(光学字符识别)时遇到的WindowsError错误,提供了具体的解决方案。 ... [详细]
author-avatar
手机用户2502904705
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有