热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Lucene正则表达式查询RegenxQuery

1*2*正则表达式查询3*456importjava.io.IOException;78importorg.apache.lucene.analysis.standard.Stan

1 /*
2 * 正则表达式查询
3 */
4
5
6 import java.io.IOException;
7
8 import org.apache.lucene.analysis.standard.StandardAnalyzer;
9 import org.apache.lucene.document.Document;
10 import org.apache.lucene.document.Field;
11 import org.apache.lucene.index.IndexWriter;
12 import org.apache.lucene.index.Term;
13 import org.apache.lucene.search.Hits;
14 import org.apache.lucene.search.IndexSearcher;
15 import org.apache.lucene.search.regex.RegexQuery; //第三方插件RegexQuery其jar为lucene-regex-2.9.4.jar
16
17
18
19 public class RegexQueryTest {
20
21 private static final String INDEX_STORE_PATH="d:\\testRegexQuery";
22
23 public static void main(String[] args) throws IOException
24 {
25 //索引
26 indexwriter(INDEX_STORE_PATH);
27 System.out.println("建立索引完毕!");
28 //查询
29 search(INDEX_STORE_PATH);
30 System.out.println("检索完毕!");
31 }
32
33 //建立索引
34 public static void indexwriter(String path) throws IOException
35 {
36 IndexWriter writer=new IndexWriter( path ,new StandardAnalyzer(),true);
37 writer.setUseCompoundFile(false);
38 //创建三个文档
39 Document doc1=new Document();
40 Document doc2=new Document();
41 Document doc3=new Document();
42 Document doc4=new Document();
43 //构建三个URL地址用于正则匹配
44 Field f1=new Field("url","http://www.abc/com/profuct?type=1& cate=5",Field.Store.YES,
45 Field.Index.UN_TOKENIZED);
46 Field f2=new Field("url","http://def.com/product?type=5",Field.Store.YES,
47 Field.Index.UN_TOKENIZED);
48 Field f3=new Field("url","http://ghi/product?type=x",Field.Store.YES,
49 Field.Index.UN_TOKENIZED);
50 Field f4=new Field("url","http://xxx.abc/con/profuct?type=1& cate=5",Field.Store.YES,
51 Field.Index.UN_TOKENIZED);
52
53 doc1.add(f1);
54 doc2.add(f2);
55 doc3.add(f3);
56 doc4.add(f4);
57 writer.addDocument(doc1);
58 writer.addDocument(doc2);
59 writer.addDocument(doc3);
60 writer.addDocument(doc4);
61
62 //close
63 writer.close();
64 }
65
66 //查询函数
67 public static void search(String path) throws IOException
68 {
69 IndexSearcher searcher=new IndexSearcher(path);
70 //创建正则表达式
71 String regex="].*";
72 //构建Term
73 Term term=new Term("url",regex);
74
75 RegexQuery query=new RegexQuery(term);
76
77 Hits hits=searcher.search(query);
78 for(int i=0;i)
79 System.out.println(hits.doc(i));
80 }
81 }

 


转载于:https://www.cnblogs.com/sl-shilong/archive/2012/12/22/2829529.html


推荐阅读
  • 正则表达式及其范例
    为什么80%的码农都做不了架构师?一、前言部分控制台输入的字符串,编译成java字符串之后才送进内存,比如控制台打\, ... [详细]
  • Java太阳系小游戏分析和源码详解
    本文介绍了一个基于Java的太阳系小游戏的分析和源码详解。通过对面向对象的知识的学习和实践,作者实现了太阳系各行星绕太阳转的效果。文章详细介绍了游戏的设计思路和源码结构,包括工具类、常量、图片加载、面板等。通过这个小游戏的制作,读者可以巩固和应用所学的知识,如类的继承、方法的重载与重写、多态和封装等。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • 本文介绍了一个Java猜拳小游戏的代码,通过使用Scanner类获取用户输入的拳的数字,并随机生成计算机的拳,然后判断胜负。该游戏可以选择剪刀、石头、布三种拳,通过比较两者的拳来决定胜负。 ... [详细]
  • Java容器中的compareto方法排序原理解析
    本文从源码解析Java容器中的compareto方法的排序原理,讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点,回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录,展示了整个讲解过程。 ... [详细]
  • JavaSE笔试题-接口、抽象类、多态等问题解答
    本文解答了JavaSE笔试题中关于接口、抽象类、多态等问题。包括Math类的取整数方法、接口是否可继承、抽象类是否可实现接口、抽象类是否可继承具体类、抽象类中是否可以有静态main方法等问题。同时介绍了面向对象的特征,以及Java中实现多态的机制。 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • 本文介绍了一种求解最小权匹配问题的方法,使用了拆点和KM算法。通过将机器拆成多个点,表示加工的顺序,然后使用KM算法求解最小权匹配,得到最优解。文章给出了具体的代码实现,并提供了一篇题解作为参考。 ... [详细]
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • 本文介绍了使用kotlin实现动画效果的方法,包括上下移动、放大缩小、旋转等功能。通过代码示例演示了如何使用ObjectAnimator和AnimatorSet来实现动画效果,并提供了实现抖动效果的代码。同时还介绍了如何使用translationY和translationX来实现上下和左右移动的效果。最后还提供了一个anim_small.xml文件的代码示例,可以用来实现放大缩小的效果。 ... [详细]
  • 本文分享了一个关于在C#中使用异步代码的问题,作者在控制台中运行时代码正常工作,但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机,但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]
  • 本文介绍了OC学习笔记中的@property和@synthesize,包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • 本文介绍了在Java中检查字符串是否仅包含数字的方法,包括使用正则表达式的示例代码,并提供了测试案例进行验证。同时还解释了Java中的字符转义序列的使用。 ... [详细]
  • Python中的PyInputPlus模块原文:https ... [详细]
author-avatar
用户r7t3govjq0
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有