热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

POI读取excel图片并定位图片需要提前注意的事项

场景介绍因为一直在使用阿里的EasyExcel也挺方便的,而且性能也是非常不错,但是有些场景还是不支持,比如说读取excel中的指定行指

场景介绍

因为一直在使用阿里的EasyExcel也挺方便的,而且性能也是非常不错,但是有些场景还是不支持,比如说读取excel中的指定行指定列的图片信息。

毕竟Apache的POI还是比较强大,对于一些图片的处理不管是word和PDF还有他们之间的相互转换都有相应的API支持。


tips:小技巧

我这里主要是想分享一下在处理excel图片的过程中所遇到的一些小问题。


  1. excel中的图片和文字等并不是统一处理的,而是分开的。
  2. 普通的文字内容能通过行列号直接能准确的定位到,图片则“不能”,为啥会主动加上引号,因为图片的位置跟他在的单元格有绝对的关系,是有边界的。下文会验证这点。
  3. 假如现在的需求是处理每一行的excel内容,并要求把图片也入库,则需要分开处理图片和别的列的内容。

实验环境

POI指定版本如下:

org.apache.poipoi-ooxml3.17

JDK版本:1.8

所用的excel文件如下图:

现在接下来就是通过POI读取到两张图片资源,并打印相应的行号和列号。

public static void main(String[] args) {// 文件路径可以根据自己需求来 我的是放在本地根路径下了File file = new File("static/image/导入图片.xlsx");XSSFWorkbook wb = null;try {wb = new XSSFWorkbook(file);} catch (IOException | InvalidFormatException e) {e.printStackTrace();}XSSFSheet sheet = wb.getSheetAt(0);List

list = sheet.getRelations();for (POIXMLDocumentPart part : list) {if (part instanceof XSSFDrawing) {XSSFDrawing drawing = (XSSFDrawing) part;List shapes = drawing.getShapes();for (XSSFShape shape : shapes) {XSSFPicture picture = (XSSFPicture) shape;PictureData pic = picture.getPictureData();XSSFClientAnchor anchor = picture.getPreferredSize();CTMarker marker = anchor.getFrom();// 获取图片格式String ext = pic.suggestFileExtension();log.info("行号[{}],单元格[{}],图片格式[{}]", marker.getRow(), marker.getCol(), ext);}}}}

以上代码也很简单,直接就能跑起来,如果按照上面excel的图片文件位置,读取出来的图片坐标也符合预期,结果如下:

但是如果把图片放置的单元格稍微拖动一下,改成这样的:不仔细看或者运营人员稍微处理不当,两个单元格出现相互覆盖的情况,读取入库可能就出现错位了。

实验结果也正是如此:

类似的如果是图片横向的覆盖左边的单元格,图片的坐标也是就近原则。效果如下:

实验结果如下:


总结:

最后我总结下:如果需求中有了类似的场景需要用到excel处理图片,并且还需要入库,数据库最好是存储图片资源的路径,次之可以把图片转成Base64也可行。

我比较推荐第一种,可以单独开一个线程来异步处理类似这样的导入导出任务,慢一点也无所谓,或者定时任务也行。

在保证图片没有错位的前提下,读取到图片后,提前先把图片上传到指定的服务器(有CDN更好)返回图片所在的行号和列号和图片资源URL,然后在读取每一行excel根据行号判断该行对应的图片资源是哪一列,把资源路径设置好,这里可以稍微处理下,如果该图片是在前端后期直接在页面上渲染,可对该资源URL加上标签。比如:

String.format("''

 


推荐阅读
  • PHP 过滤器详解
    本文深入探讨了 PHP 中的过滤器机制,包括常见的 $_SERVER 变量、filter_has_var() 函数、filter_id() 函数、filter_input() 函数及其数组形式、filter_list() 函数以及 filter_var() 和其数组形式。同时,详细介绍了各种过滤器的用途和用法。 ... [详细]
  • Struts与Spring框架的集成指南
    本文详细介绍了如何将Struts和Spring两个流行的Java Web开发框架进行整合,涵盖从环境配置到代码实现的具体步骤。 ... [详细]
  • 在网站制作中随时可用的10个 HTML5 代码片段
    HTML很容易写,但创建网页时,您经常需要重复做同样的任务,如创建表单。在这篇文章中,我收集了10个超有用的HTML代码片段,有HTML5启动模板、空白图片、打电话和发短信、自动完 ... [详细]
  • 深入解析Redis内存对象模型
    本文详细介绍了Redis内存对象模型的关键知识点,包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析,帮助读者全面理解Redis内存管理机制。 ... [详细]
  • 阿里云ecs怎么配置php环境,阿里云ecs配置选择 ... [详细]
  • 简化报表生成:EasyReport工具的全面解析
    本文详细介绍了EasyReport,一个易于使用的开源Web报表工具。该工具支持Hadoop、HBase及多种关系型数据库,能够将SQL查询结果转换为HTML表格,并提供Excel导出、图表显示和表头冻结等功能。 ... [详细]
  • 本文介绍如何使用 Python 获取文件和图片的创建、修改及拍摄日期。通过多种方法,如 PIL 库的 _getexif() 函数和 os 模块的 getmtime() 和 stat() 方法,详细讲解了这些技术的应用场景和注意事项。 ... [详细]
  • PostgreSQL 10 离线安装指南
    本文详细介绍了如何在无法联网的服务器上进行 PostgreSQL 10 的离线安装,并涵盖了从下载安装包到配置远程访问的完整步骤。 ... [详细]
  • 本文详细探讨了网站流量统计中常用的三个关键指标:页面浏览量(PV)、独立访客数(UV)和独立IP数(IP)。通过分析这些指标的定义、计算方法及其应用场景,帮助网站运营者更好地理解用户行为,优化网站内容与用户体验。 ... [详细]
  • 在众多不为人知的软件中,这些工具凭借其卓越的功能和高效的性能脱颖而出。本文将为您详细介绍其中八款精品软件,帮助您提高工作效率。 ... [详细]
  • 本文将介绍网易NEC CSS框架的规范及其在实际项目中的应用。通过详细解析其分类和命名规则,探讨如何编写高效、可维护的CSS代码,并分享一些实用的学习心得。 ... [详细]
  • HBase运维工具全解析
    本文深入探讨了HBase常用的运维工具,详细介绍了每种工具的功能、使用场景及操作示例。对于HBase的开发人员和运维工程师来说,这些工具是日常管理和故障排查的重要手段。 ... [详细]
  • 本文介绍了MindManager在项目管理中的强大功能,特别是其内置的甘特图工具。通过该工具,用户可以轻松创建和管理项目计划,优化任务分配,并与其他软件无缝集成。 ... [详细]
  • ABBYY FineReader:高效PDF转换、精准OCR识别与文档对比工具
    在处理PDF转换和OCR识别时,您是否遇到过格式混乱、识别率低或图表无法正常识别的问题?ABBYY FineReader以其强大的功能和高精度的识别技术,完美解决这些问题,帮助您轻松找到最终版文档。 ... [详细]
  • 本文介绍了解决在Windows操作系统或SQL Server Management Studio (SSMS) 中遇到的“microsoft.ACE.oledb.12.0”提供程序未注册问题的方法,特别针对Access Database Engine组件的安装。 ... [详细]
author-avatar
手机用户2502904705
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有