Lucene正则表达式查询RegenxQuery

作者：用户r7t3govjq0 | 来源：互联网 | 2023-08-27 13:23

1*2*正则表达式查询3*456importjava.io.IOException;78importorg.apache.lucene.analysis.standard.Stan

1 /*
2 * 正则表达式查询
3 */
4
5
6 import java.io.IOException;
7
8 import org.apache.lucene.analysis.standard.StandardAnalyzer;
9 import org.apache.lucene.document.Document;
10 import org.apache.lucene.document.Field;
11 import org.apache.lucene.index.IndexWriter;
12 import org.apache.lucene.index.Term;
13 import org.apache.lucene.search.Hits;
14 import org.apache.lucene.search.IndexSearcher;
15 import org.apache.lucene.search.regex.RegexQuery; //第三方插件RegexQuery其jar为lucene-regex-2.9.4.jar
16
17
18
19 public class RegexQueryTest {
20
21 private static final String INDEX_STORE_PATH&＃61;"d:\\testRegexQuery";
22
23 public static void main(String[] args) throws IOException
24 {
25 //索引
26 indexwriter(INDEX_STORE_PATH);
27 System.out.println("建立索引完毕&＃xff01;");
28 //查询
29 search(INDEX_STORE_PATH);
30 System.out.println("检索完毕&＃xff01;");
31 }
32
33 //建立索引
34 public static void indexwriter(String path) throws IOException
35 {
36 IndexWriter writer&＃61;new IndexWriter( path ,new StandardAnalyzer(),true);
37 writer.setUseCompoundFile(false);
38 //创建三个文档
39 Document doc1&＃61;new Document();
40 Document doc2&＃61;new Document();
41 Document doc3&＃61;new Document();
42 Document doc4&＃61;new Document();
43 //构建三个URL地址用于正则匹配
44 Field f1&＃61;new Field("url","http://www.abc/com/profuct?type&＃61;1& cate&＃61;5",Field.Store.YES,
45 Field.Index.UN_TOKENIZED);
46 Field f2&＃61;new Field("url","http://def.com/product?type&＃61;5",Field.Store.YES,
47 Field.Index.UN_TOKENIZED);
48 Field f3&＃61;new Field("url","http://ghi/product?type&＃61;x",Field.Store.YES,
49 Field.Index.UN_TOKENIZED);
50 Field f4&＃61;new Field("url","http://xxx.abc/con/profuct?type&＃61;1& cate&＃61;5",Field.Store.YES,
51 Field.Index.UN_TOKENIZED);
52
53 doc1.add(f1);
54 doc2.add(f2);
55 doc3.add(f3);
56 doc4.add(f4);
57 writer.addDocument(doc1);
58 writer.addDocument(doc2);
59 writer.addDocument(doc3);
60 writer.addDocument(doc4);
61
62 //close
63 writer.close();
64 }
65
66 //查询函数
67 public static void search(String path) throws IOException
68 {
69 IndexSearcher searcher&＃61;new IndexSearcher(path);
70 //创建正则表达式
71 String regex&＃61;"].*";
72 //构建Term
73 Term term&＃61;new Term("url",regex);
74
75 RegexQuery query&＃61;new RegexQuery(term);
76
77 Hits hits&＃61;searcher.search(query);
78 for(int i&＃61;0;i)
79 System.out.println(hits.doc(i));
80 }
81 }

转载于:https://www.cnblogs.com/sl-shilong/archive/2012/12/22/2829529.html

推荐阅读

version
正则表达式及其范例

为什么80%的码农都做不了架构师？一、前言部分控制台输入的字符串，编译成java字符串之后才送进内存，比如控制台打\， ... [详细]

蜡笔小新 2023-10-17 20:18:36
int
Java太阳系小游戏分析和源码详解

本文介绍了一个基于Java的太阳系小游戏的分析和源码详解。通过对面向对象的知识的学习和实践，作者实现了太阳系各行星绕太阳转的效果。文章详细介绍了游戏的设计思路和源码结构，包括工具类、常量、图片加载、面板等。通过这个小游戏的制作，读者可以巩固和应用所学的知识，如类的继承、方法的重载与重写、多态和封装等。 ... [详细]

蜡笔小新 2023-12-14 19:53:34
int
在类中定义数组时出错 - Error on defining arrays in class

Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]

蜡笔小新 2023-12-14 17:38:12
int
Java猜拳小游戏代码

本文介绍了一个Java猜拳小游戏的代码，通过使用Scanner类获取用户输入的拳的数字，并随机生成计算机的拳，然后判断胜负。该游戏可以选择剪刀、石头、布三种拳，通过比较两者的拳来决定胜负。 ... [详细]

蜡笔小新 2023-12-14 15:39:08
int
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
int
JavaSE笔试题-接口、抽象类、多态等问题解答

本文解答了JavaSE笔试题中关于接口、抽象类、多态等问题。包括Math类的取整数方法、接口是否可继承、抽象类是否可实现接口、抽象类是否可继承具体类、抽象类中是否可以有静态main方法等问题。同时介绍了面向对象的特征，以及Java中实现多态的机制。 ... [详细]

蜡笔小新 2023-12-14 10:01:13
int
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
int
拆点+KM，建图思路看的题解，求解最小权匹配问题

本文介绍了一种求解最小权匹配问题的方法，使用了拆点和KM算法。通过将机器拆成多个点，表示加工的顺序，然后使用KM算法求解最小权匹配，得到最优解。文章给出了具体的代码实现，并提供了一篇题解作为参考。 ... [详细]

蜡笔小新 2023-12-09 09:24:15
int
GetWindowLong函数

今天在看一个代码里头写了GetWindowLong(hwnd,0)，我当时就有点费解，靠，上网搜索函数原型说明，死活找不到第 ... [详细]

蜡笔小新 2023-12-14 17:58:15
version
kotlin动画实现上下移动、放大缩小、旋转功能

本文介绍了使用kotlin实现动画效果的方法，包括上下移动、放大缩小、旋转等功能。通过代码示例演示了如何使用ObjectAnimator和AnimatorSet来实现动画效果，并提供了实现抖动效果的代码。同时还介绍了如何使用translationY和translationX来实现上下和左右移动的效果。最后还提供了一个anim_small.xml文件的代码示例，可以用来实现放大缩小的效果。 ... [详细]

蜡笔小新 2023-12-14 17:29:08
int
C#学习教程：在Console中工作但在Windows窗体中不工作的异步代码分享

本文分享了一个关于在C#中使用异步代码的问题，作者在控制台中运行时代码正常工作，但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机，但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]

蜡笔小新 2023-12-14 15:56:00
copy
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
int
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
int
Java中检查字符串是否仅包含数字的方法及示例代码

本文介绍了在Java中检查字符串是否仅包含数字的方法，包括使用正则表达式的示例代码，并提供了测试案例进行验证。同时还解释了Java中的字符转义序列的使用。 ... [详细]

蜡笔小新 2023-12-10 12:58:56
input
Python 中的 PyInputPlus 模块

Python中的PyInputPlus模块原文:https ... [详细]

蜡笔小新 2023-10-17 20:32:43

用户r7t3govjq0

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章