索引的读取工具IndexReader

作者：雷神白中凌 | 来源：互联网 | 2023-06-28 08:06

索引的读取工具IndexReader在Lucene中的index包中有一个重要的工具IndexReader。它主要负责对索引的各种读取和维护工作。IndexReader本身是一个抽

//索引的读取工具IndexReader
//在Lucene中的index包中有一个重要的工具IndexReader。
//它主要负责对索引的各种读取和维护工作。
//IndexReader本身是一个抽象类。它有一个子类MultiReader&＃xff0c;
//通常&＃xff0c;无须关注其子类的实现&＃xff0c;因为IndexReader本身提供了一个静态方法
//来获取一个它的子类的实现
package index;

import java.io.IOException;

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.Term;
import org.apache.lucene.index.TermDocs;

public class IndexWriter {

IndexReader reader &＃61; IndexReader.open(INDEX_STORE_PATH);

//创建索引
IndexWriter writer &＃61; new IndexWriter(INDEX_STORE_PATH, new StandardAnalyzer(), true);
writer.setUseCompoundFile(false);

Document doc1 &＃61; new Document();
Document doc2 &＃61; new Document();
Document doc3 &＃61; new Document();

Field f1 &＃61; new Field("bookname", "钢铁是怎么样炼成的", Field.Store.YES, Field.Index.TOKENIZED);
Field f2 &＃61; new Field("bookname", "英雄儿女", Field.Store.YES, Field.Index.TOKENIZED);
Field f3 &＃61; new Field("bookname", "篱笆女人和狗", Field.Store.YES, Field.Index.TOKENIZED);
doc1.add(f1);
doc2.add(f2);
doc3.add(f3);
writer.addDocument(doc1);
writer.addDocument(doc2);
writer.addDocument(doc3);
writer.close();

//使用IndexReader来读取索引
IndexReader reader&＃61; IndexReader.open(INDEX_STORE_PATH);

//显示索引内所有的Document
System.out.println("索引文档列表: ");
for(int i &＃61; 0; i System.out.println(reader.document(i));
}

//输出当前索引的版本信息
System.out.println("版本: " &＃43; reader.getVersion());

//输出当前索引的文档数量
System.out.println("索内的文档数量: " &＃43; reader.numDocs());

//构造一个词条并在索引中查找
System.out.println();
System.out.println("查找词条 &＃39;女&＃39; ");
Term term1 &＃61; new Term("bookname", "女");
TermDocs docs &＃61; reader.termDocs(term1);
while(docs.next()){
System.out.println("---------------------");
System.out.println("含有所有查找的<" &＃43; term1 &＃43; ">的Docuemnt的编号为" &＃43; docs.doc());
System.out.println("Term在文档中的出现次数" &＃43; docs.freq());
System.out.println("---------------------");
}

reader.close();

//在此向索引目录中添加一个文档
IndexWriter writer2 &＃61; new IndexWriter(INDEX_STORE_PATH, new StandardAnalyzer(), false);
writer2.serUseCompoundFile(false);
Document doc4 &＃61; new Document();
Field f4 &＃61; new Field("bookname", "钢铁战士", Field.Store.YES, Field.Index.TOKENIZED);
doc4.add(f4);
writer2.addDocument(doc4);
writer2.close();

System.out.println("&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;&＃61;");

//使用IndexReader来读取索引
IndexReader reader2 &＃61; new IndexReader.open(INDEX_STORE_PATH);

//显示索引中的所有文件
for(int i &＃61; 0; i System.out.println(reader2.document(i));
}

//输出当前索引的版本信息
System.out.println("版本" &＃43; reader2.getVersion());

//输出当前索引的文档数量
System.out.println("索内的文的数量" &＃43; reader2.numDocs());

System.out.println("查找词条&＃39;女&＃39;");
Term term2 &＃61; new Term("bookname", "女");
docs &＃61; reader.termDocs(term2);
while(docs.next()){
System.out.println("------------------------");
System.out.println("含有所查找的<" &＃43; term2 &＃43; ">的Document的编号为 " &＃43; docs.doc());
System.out.println("Term在文档中出现的次数" &＃43; docs.freq());
System.out.println("------------------------");
}

System.out.println();
System.out.println("查找词条&＃39;钢&＃39;");
Term term3 &＃61; new Term("bookname","钢");
docs &＃61; reader2.termDocs(term3);
while(docs.next()){
System.out.println("------------------------");
System.out.println("含有所查找的<" &＃43; term3 &＃43; ">的Document的编号为 " &＃43; docs.doc());
System.out.println("Term在文档中出现的次数" &＃43; docs.freq());
System.out.println("------------------------");
}
}

推荐阅读

java
优化后的标题：深入探讨网关安全：将微服务升级为OAuth2资源服务器的最佳实践

本文深入探讨了如何将微服务升级为OAuth2资源服务器，以订单服务为例，详细介绍了在POM文件中添加 `spring-cloud-starter-oauth2` 依赖，并配置Spring Security以实现对微服务的保护。通过这一过程，不仅增强了系统的安全性，还提高了资源访问的可控性和灵活性。文章还讨论了最佳实践，包括如何配置OAuth2客户端和资源服务器，以及如何处理常见的安全问题和错误。 ... [详细]

蜡笔小新 2024-11-09 16:13:27
java
HDFS API

Hadoop的文件操作位于包org.apache.hadoop.fs里面，能够进行新建、删除、修改等操作。比较重要的几个类：(1)Configurati ... [详细]

蜡笔小新 2024-11-13 17:31:50
java
使用Java和PDFBox实现PDF局部切割

本文介绍了如何使用Java和PDFBox库根据坐标值对PDF文件进行局部切割的方法。 ... [详细]

蜡笔小新 2024-11-13 13:04:52
random
Spring Boot 中配置全局文件上传路径并实现文件上传功能

本文介绍如何在 Spring Boot 项目中配置全局文件上传路径，并通过读取配置项实现文件上传功能。通过这种方式，可以更好地管理和维护文件路径。 ... [详细]

蜡笔小新 2024-11-13 11:19:38
java
Java 并发编程：深入解析 AtomicInteger 和 CAS 无锁算法

在多线程并发环境中，普通变量的操作往往是线程不安全的。本文通过一个简单的例子，展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]

蜡笔小新 2024-11-12 16:40:04
eval
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
java
基于CXF框架的Web服务开发详细示例

在Java Web服务开发中，Apache CXF 和 Axis2 是两个广泛使用的框架。CXF 由于其与 Spring 框架的无缝集成能力，以及更简便的部署方式，成为了许多开发者的首选。本文将详细介绍如何使用 CXF 框架进行 Web 服务的开发，包括环境搭建、服务发布和客户端调用等关键步骤，为开发者提供一个全面的实践指南。 ... [详细]

蜡笔小新 2024-11-08 18:43:17
java
Pentaho Kettle 中 RowMetaInterface.writeMeta 方法详解与代码示例

本文详细介绍了 Pentaho Kettle 中 RowMetaInterface.writeMeta 方法的使用，并提供了多个代码示例，帮助开发者更好地理解和应用该方法。 ... [详细]

蜡笔小新 2024-11-13 16:21:25
bash
CentOS 7 中配置开机自动挂载 NFS 的解决方案

本文详细介绍了在 CentOS 7 系统中配置 fstab 文件以实现开机自动挂载 NFS 共享目录的方法，并解决了常见的配置失败问题。 ... [详细]

蜡笔小新 2024-11-13 12:05:24
java
com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例

com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 10:47:33
get
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新 2024-11-12 16:19:40
join
Spring详解（六）AOP

原文网址：https:www.cnblogs.comysoceanp7476379.html目录1、AOP什么？2、需求3、解决办法1:使用静态代理4 ... [详细]

蜡笔小新 2024-11-12 14:40:40
get
实验九：使用SharedPreferences存储简单数据

本实验旨在帮助学生理解和掌握使用SharedPreferences存储和读取简单数据的方法，包括程序参数和用户选项。 ... [详细]

蜡笔小新 2024-11-12 14:21:47
get
使用Python和smtplib实现邮件发送功能

本文详细介绍了如何使用Python中的smtplib库来发送带有附件的邮件，并提供了完整的代码示例。作者：多测师_王sir，时间：2020年5月20日 17:24，微信：15367499889，公司：上海多测师信息有限公司。 ... [详细]

蜡笔小新 2024-11-12 12:21:27
join
python解决CSF布料模拟滤波的批处理问题（解决获取多个点云数据las数据）

解决问题：1、批量读取点云las数据2、点云数据读与写出3、csf滤波分类参考：https:github.comsuyunzzzCSF论文题目ÿ ... [详细]

蜡笔小新 2024-11-12 11:32:15

雷神白中凌

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章