LIRE(LuceneImageRetrieval)相似图像索引和搜索机制

作者：Ww不孤单_584 | 来源：互联网 | 2023-07-24 12:32

众说周知，lucene是一个开源的强大的索引工具，但是它仅限于文本索引。基于内容的图像检索(CBIR)要求我们利用图像的一些基本特征（如颜

众说周知，lucene是一个开源的强大的索引工具，但是它仅限于文本索引。基于内容的图像检索(CBIR)要求我们利用图像的一些基本特征（如颜色纹理形状以及sift,surf等等）搜索相似的图片，LIRE(Lucene Image Retrieval)是一款基于lucene的图像特征索引工具，它能帮助我们方便的对图像特征建立索引和搜索，作者也在不断加入新的特征供用户使用。如果你熟悉lucene，那么用LIRE提取特征建立索引是非常方便的。

LIRE官网： http://www.semanticmetadata.net/lire/

包和源码： http://code.google.com/p/lire/

基本使用示例： http://www.semanticmetadata.net/wiki/doku.php?id=start

API： http://www.itec.uni-klu.ac.at/lire/nightly/api/index.html

本文不讨论API的调用方法，我粗略的读了下lire的源码，在这里对它的机制做个简单的说明。

LireFeature是图像特征的接口，具体的特征提取，距离计算，表示都有各自实现的类。值得一提的是，LIRE的作者实现了非常多的特征提取方法，而且都是java实现的，也没有借助opencv等工具，在此之前我能看到的sift特征提取都是c或者c++实现的。

public interface LireFeature {public void extract(BufferedImage bimg);public byte[] getByteArrayRepresentation();public void setByteArrayRepresentation(byte[] in);public void setByteArrayRepresentation(byte[] in, int offset, int length);public double[] getDoubleHistogram();float getDistance(LireFeature feature);java.lang.String getStringRepresentation();void setStringRepresentation(java.lang.String s);
}

DocumentBuilder是建立Document的接口类，Document就是lucene中的文档，它建立的文档包含了图像的某个特征和图像的标识字符串两个Field。

public Document createDocument(BufferedImage image, String identifier) throws FileNotFoundException;

ChainedDocumentBuilder可以建立将多个特征综合起来的文档。

DocumentBuilderFactory是DocumentBuilder的工厂类，由它初始化各个特征的DocumentBuilder。

通过调用createDocument就能返回每个图像对应特征和标识的文档，用lucene的IndexWriter就能将它写入索引文件。

SimpleResult是单个搜索的结果，它包含3个成员变量，分别是距离（相似度），文档和索引号。它实现了Comparable接口，排序的方法是按照相似度的由高到底排序，如果相似度一样，就按照索引号在前的排在前面。

public class SimpleResult implements Comparable {private float distance;private Document document;private int indexNumber = 0;public int compareTo(SimpleResult o) {int compareValue = (int) Math.signum(distance - ((SimpleResult) o).distance);if (compareValue==0 && !document.equals(o.document)) {return (int) Math.signum(indexNumber-o.indexNumber);}return compareValue;}@Overridepublic boolean equals(Object obj) {// it&＃39;s not the same if it&＃39;s not the same class.if (! (obj instanceof SimpleResult)) return false;// it&＃39;s the same if the document is the same, regardless of the distance.else return (document.equals(((SimpleResult)obj).document) && indexNumber == ((SimpleResult)obj).indexNumber);}
}

ImageSearcherFactory是搜索的工厂类，由它初始化各个特征的搜索类。

这里主要讲一下GenericFastImageSearcher类，很多特征都能通过它来搜索，它的成员变量maxHits为搜索结果的个数，TreeSet docs是排序的搜索结果，float maxDistance搜索结果中的最大距离。

protected float findSimilar(IndexReader reader, LireFeature lireFeature) throws IOException {maxDistance = -1f;overallMaxDistance = -1f;// clear result set ...docs.clear();// Needed for check whether the document is deleted.Bits liveDocs = MultiFields.getLiveDocs(reader);Document d;float tmpDistance;int docs = reader.numDocs();for (int i = 0; i = 0);// calculate the overall max distance to normalize score afterwardsif (overallMaxDistance maxDistance) maxDistance = tmpDistance;} else if (tmpDistance
从它的findSimilar方法可以看出，它的实现是线性检索的，也就是从头到尾遍历所有文档，并且维护一个maxHits大小的TreeSet，TreeSet里面放的是距离最小的maxHits个搜索结果。如果有不理解此过程的童鞋，可以参考一下“TOP N搜索算法”。

public ImageSearchHits search(BufferedImage image, IndexReader reader) throws IOException {logger.finer("Starting extraction.");LireFeature lireFeature = null;SimpleImageSearchHits searchHits = null;try {lireFeature = (LireFeature) descriptorClass.newInstance();// Scaling image is especially with the correlogram features very important!BufferedImage bimg = image;if (Math.max(image.getHeight(), image.getWidth()) > GenericDocumentBuilder.MAX_IMAGE_DIMENSION) {bimg = ImageUtils.scaleImage(image, GenericDocumentBuilder.MAX_IMAGE_DIMENSION);}lireFeature.extract(bimg);logger.fine("Extraction from image finished");float maxDistance = findSimilar(reader, lireFeature);searchHits = new SimpleImageSearchHits(this.docs, maxDistance);} catch (InstantiationException e) {logger.log(Level.SEVERE, "Error instantiating class for generic image searcher: " + e.getMessage());} catch (IllegalAccessException e) {logger.log(Level.SEVERE, "Error instantiating class for generic image searcher: " + e.getMessage());}return searchHits;}
search方法返回的是ImageSearchHits，它就是ArrayList results;并且利用findSimilar遍历时最大的distance做了个归一化操作， result.setDistance(1f - result.getDistance() / maxDistance);作用就是将距离变成了相似度（0到1），并且数值越大就越相似。

以上就是我粗略看的一些部分，可以看出lire的搜索过程其实是线性搜索的，由于具体的特征表示没来的及看，不知道它到底有没有利用lucene的倒排优势（对于高维数据还真不知道怎么利用倒排表）。对于大规模的数据速度估计够呛，好在lire的作者也意识到了这一点， http://www.semanticmetadata.net/2013/03/20/large-image-data-sets-with-lire-some-new-numbers/作者表示正在把LSH算法（Locality sensitive hashing）集成进去，LSH对于这种高维数据的相似检索速度可以说是质的飞跃。

自己做的一些实验，大概13万张图片，用的CEDD特征，索引文件只用了不到30M的大小，检索速度没测，目测1秒以内。

左上第一张图片就是输入图片。

作者：fengzhe0411 发表于2013-4-9 11:07:42 原文链接

推荐阅读

main
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
main
字节流(InputStream和OutputStream)，字节流读写文件，字节流的缓冲区，字节缓冲流

字节流抽象类InputStream和OutputStream是字节流的顶级父类所有的字节输入流都继承自InputStream，所有的输出流都继承子OutputStreamInput ... [详细]

蜡笔小新 2024-11-12 14:07:25
main
Java Socket 关键参数详解与优化建议

Java Socket 的 API 虽然被广泛使用，但其关键参数的用途却鲜为人知。本文详细解析了 Java Socket 中的重要参数，如 backlog 参数，它用于控制服务器等待连接请求的队列长度。此外，还探讨了其他参数如 SO_TIMEOUT、SO_REUSEADDR 等的配置方法及其对性能的影响，并提供了优化建议，帮助开发者提升网络通信的稳定性和效率。 ... [详细]

蜡笔小新 2024-11-09 21:38:05
main
FFMpeg学习进阶：音频处理基础理论与重采样技术详解

在Android平台中，播放音频的采样率通常固定为44.1kHz，而录音的采样率则固定为8kHz。为了确保音频设备的正常工作，底层驱动必须预先设定这些固定的采样率。当上层应用提供的采样率与这些预设值不匹配时，需要通过重采样（resample）技术来调整采样率，以保证音频数据的正确处理和传输。本文将详细探讨FFMpeg在音频处理中的基础理论及重采样技术的应用。 ... [详细]

蜡笔小新 2024-11-09 13:46:55
ip
com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例

com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 10:47:33
ip
解决Only fullscreen opaque activities can request orientation错误的方法

本文介绍了在使用PictureSelectorLight第三方框架时遇到的Only fullscreen opaque activities can request orientation错误，并提供了一种有效的解决方案。 ... [详细]

蜡笔小新 2024-11-13 09:46:25
main
面试中如何回答“零拷贝”技术问题？

零拷贝技术是提高I/O性能的重要手段，常用于Java NIO、Netty、Kafka等框架中。本文将详细解析零拷贝技术的原理及其应用。 ... [详细]

蜡笔小新 2024-11-13 02:03:52
ip
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57
object
深入解析 Lifecycle 的实现原理

本文将详细介绍 Android Jetpack 中 Lifecycle 组件的实现原理，帮助开发者更好地理解和使用 Lifecycle，避免常见的内存泄漏问题。 ... [详细]

蜡笔小新 2024-11-12 14:05:19
ip
解决Bootstrap DataTable Ajax请求重复问题

在最近的一个项目中，我们使用了JQuery DataTable进行数据展示，虽然使用起来非常方便，但在测试过程中发现了一个问题：当查询条件改变时，有时查询结果的数据不正确。通过FireBug调试发现，点击搜索按钮时，会发送两次Ajax请求，一次是原条件的请求，一次是新条件的请求。 ... [详细]

蜡笔小新 2024-11-12 13:59:27
ip
深入解析浏览器内核与版本的发展历程

浏览器作为我们日常不可或缺的软件工具，其背后的运作机制却鲜为人知。本文将深入探讨浏览器内核及其版本的演变历程，帮助读者更好地理解这一关键技术组件，揭示其内部运作的奥秘。 ... [详细]

蜡笔小新 2024-11-11 13:34:37
default
基于Net Core 3.0与Web API的前后端分离开发：Vue.js在前端的应用

本文介绍了如何使用Net Core 3.0和Web API进行前后端分离开发，并重点探讨了Vue.js在前端的应用。后端采用MySQL数据库和EF Core框架进行数据操作，开发环境为Windows 10和Visual Studio 2019，MySQL服务器版本为8.0.16。文章详细描述了API项目的创建过程、启动步骤以及必要的插件安装，为开发者提供了一套完整的开发指南。 ... [详细]

蜡笔小新 2024-11-11 10:58:21
main
Android 构建基础流程详解

Android 构建基础流程详解 ... [详细]

蜡笔小新 2024-11-10 15:45:20
main
深入剖析Java中SimpleDateFormat在多线程环境下的潜在风险与解决方案

深入剖析Java中SimpleDateFormat在多线程环境下的潜在风险与解决方案 ... [详细]

蜡笔小新 2024-11-09 19:04:36
main
线程能否先以安全方式获取对象，再进行非安全发布？

线程能否先以安全方式获取对象，再进行非安全发布？ ... [详细]

蜡笔小新 2024-11-09 09:21:53

Ww不孤单_584

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章