如何为lucene添加多个AND布尔查询

作者：你好cd_197 | 来源：互联网 | 2023-05-29 11:31

如何解决《如何为lucene添加多个AND布尔查询》经验，为你挑选了1个好方法。

我有1000万个lucene文件,看起来像这样:

{
     "0": 230,
     "1": 12,
     "2": 611,
     "3": 800
}

我试图找到所有文件,所有字段都小于10.这是我有的lucene代码:

BooleanQuery bq = new BooleanQuery();
bq.Add(NumericRangeQuery.NewIntRange("0", 1, 10, true, true), Occur.MUST);
bq.Add(NumericRangeQuery.NewIntRange("1", 1, 10 , true, true), Occur.MUST);
bq.Add(NumericRangeQuery.NewIntRange("2", 1, 10, true, true), Occur.MUST);
//bq.Add(NumericRangeQuery.NewIntRange("3", 1, 1000, true, true), Occur.MUST);

TopDocs hits = searcher.Search(bq, 10);
int counter = 0;
foreach (ScoreDoc scoreDoc in hits.ScoreDocs)
{

   Lucene.Net.Documents.Document doc = searcher.Doc(scoreDoc.Doc);
   Console.WriteLine("3: " + doc.Get("3"));
   counter++;
}

我遇到的问题是,当我检查所有4个属性以查看是否所有4个属性都在1到10之间时,我没有得到任何结果.当我检查前3个属性时,我得到了正确的结果.但是,当我添加第四个时,我什么也得不到.正如您所看到的那样,第四个布尔子句被注释掉了,因为它不会产生任何结果.我甚至在1到1000之间的整个范围内进行了第四次财产检查,但我仍然没有结果.难道我做错了什么？以下是我构建索引的方法.

public static void BuildIndex()
{
    Directory directory = FSDirectory.Open(new System.IO.DirectoryInfo("C:\\Users\\Luke\\Desktop\\1"));
    Analyzer analyzer = new Lucene.Net.Analysis.Standard.StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_30);
    IndexWriter writer = new IndexWriter(directory, analyzer, new IndexWriter.MaxFieldLength(100000));


    for (int x = 0; x <10000000; x++)
    {
        Document doc = new Document();
        doc.Add(new NumericField("id", 100000, Field.Store.YES, true).SetIntValue(x));
        for (int i = 0; i <5; i++)
        {
            doc.Add(new NumericField(i.ToString(), 100000, Field.Store.YES, true).SetIntValue(rand.Next(1, 1000)));
        }

        writer.AddDocument(doc);
        if (x % 500 == 0)
        {
            Console.WriteLine(x);
        }
    }

    writer.Optimize();
    writer.Flush(true, true, true);
    writer.Dispose();
    directory.Dispose();

    Console.WriteLine("done");
    Console.Read();
}

Rushik.. 5

我刚刚在Java Lucene(4.4)中重新创建了这个程序,我在数值范围查询中没有看到任何问题.

1)3份文件

field:0 - value:137
field:1 - value:41
field:2 - value:908
field:3 - value:871
field:4 - value:686

field:0 - value:598
field:1 - value:623
field:2 - value:527
field:3 - value:364
field:4 - value:800

field:0 - value:96
field:1 - value:301
field:2 - value:323
field:3 - value:94
field:4 - value:653

2)索引器

package com.numericrange;

import java.io.File;
import java.io.IOException;

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.IntField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.IndexWriterConfig.OpenMode;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

public class IndexBuilder
{

    /**
     * @param args
     * @throws IOException 
     */
    public static void main(String[] args) throws IOException
    {
        Directory dir = FSDirectory.open(new File("/Users/Lucene/indexes"));
        IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_44, new StandardAnalyzer(Version.LUCENE_44));
        iwc.setOpenMode(OpenMode.CREATE);
        IndexWriter writer = new IndexWriter(dir, iwc);

        for (int x = 0; x <3; x++)
        {
            Document doc = new Document();
            IntField iFldOut = new IntField("id", 6, Field.Store.YES);
            iFldOut.setIntValue(x);
            doc.add(iFldOut);
            for (int i = 0; i <5; i++)
            {
                int randomVal = (int)(Math.random() * 1000) + 1;
                IntField iFld = new IntField(Integer.toString(i), 6, Field.Store.YES);
                iFld.setIntValue(randomVal);
                doc.add(iFld);
                System.out.println("i:" + i + " - Random Value:" + randomVal);
            }

            writer.addDocument(doc);

        }
        int newNumDocs = writer.numDocs();
        System.out.println("************************");
        System.out.println(newNumDocs + " documents added.");
        System.out.println("************************");

        writer.close();
    }

}

3)搜索

package com.numericrange;

import java.io.File;
import java.io.IOException;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.search.BooleanClause.Occur;
import org.apache.lucene.search.BooleanQuery;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.NumericRangeQuery;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopScoreDocCollector;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

public class NumericQueryDemo
{

    public static void main(String[] args) throws IOException, Exception
    {
        // Use Indexes from existing folder
        String dirPath = "/Users/Lucene/indexes";
        IndexReader reader = DirectoryReader.open(FSDirectory.open(new File(dirPath)));
        IndexSearcher searcher = new IndexSearcher(reader);

        Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_44);

        BooleanQuery bq = new BooleanQuery();
        bq.add(NumericRangeQuery.newIntRange("0", 100, 600, true, true), Occur.MUST);
        bq.add(NumericRangeQuery.newIntRange("1", 40, 700, true, true), Occur.MUST);
        bq.add(NumericRangeQuery.newIntRange("2", 500, 1000, true, true), Occur.MUST);
        bq.add(NumericRangeQuery.newIntRange("3", 300, 900, true, true), Occur.MUST);
        bq.add(NumericRangeQuery.newIntRange("4", 600, 800, true, true), Occur.MUST);
        System.out.println("Query Data:" + bq.toString());

        TopScoreDocCollector collector = TopScoreDocCollector.create(500, true);
        long startTime = System.currentTimeMillis();
        searcher.search(bq, collector);
        System.out.println("Search Time: "+(System.currentTimeMillis() - startTime)+"ms");

        // Display Results
        ScoreDoc[] hits = collector.topDocs().scoreDocs;
        System.out.println("Found " + hits.length + " hits.");
        for(int i=0; i 

4)搜索结果

Query Data:+0:[100 TO 600] +1:[40 TO 700] +2:[500 TO 1000] +3:[300 TO 900] +4:[600 TO 800]
Search Time: 27ms
Found 2 hits.
1. 2.236068 0 ==== 137 ==== 41 ==== 908 ==== 871 ==== 686
2. 2.236068 1 ==== 598 ==== 623 ==== 527 ==== 364 ==== 800


如您所见,我使用的是precisionStep值为'6'.我验证了文件通过Luke正确编入索引,并通过Luke解雇了相同的查询.

你能尝试通过Luke界面触发查询吗？根据您的文档更改值.

+0:[100至600] +1:[40至700] +2:[500至1000] +3:[300至900] +4:[600至800]


1> Rushik..：
我刚刚在Java Lucene(4.4)中重新创建了这个程序,我在数值范围查询中没有看到任何问题.

1)3份文件

field:0 - value:137
field:1 - value:41
field:2 - value:908
field:3 - value:871
field:4 - value:686

field:0 - value:598
field:1 - value:623
field:2 - value:527
field:3 - value:364
field:4 - value:800

field:0 - value:96
field:1 - value:301
field:2 - value:323
field:3 - value:94
field:4 - value:653


2)索引器 

package com.numericrange;

import java.io.File;
import java.io.IOException;

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.IntField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.IndexWriterConfig.OpenMode;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

public class IndexBuilder
{

    /**
     * @param args
     * @throws IOException 
     */
    public static void main(String[] args) throws IOException
    {
        Directory dir = FSDirectory.open(new File("/Users/Lucene/indexes"));
        IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_44, new StandardAnalyzer(Version.LUCENE_44));
        iwc.setOpenMode(OpenMode.CREATE);
        IndexWriter writer = new IndexWriter(dir, iwc);

        for (int x = 0; x <3; x++)
        {
            Document doc = new Document();
            IntField iFldOut = new IntField("id", 6, Field.Store.YES);
            iFldOut.setIntValue(x);
            doc.add(iFldOut);
            for (int i = 0; i <5; i++)
            {
                int randomVal = (int)(Math.random() * 1000) + 1;
                IntField iFld = new IntField(Integer.toString(i), 6, Field.Store.YES);
                iFld.setIntValue(randomVal);
                doc.add(iFld);
                System.out.println("i:" + i + " - Random Value:" + randomVal);
            }

            writer.addDocument(doc);

        }
        int newNumDocs = writer.numDocs();
        System.out.println("************************");
        System.out.println(newNumDocs + " documents added.");
        System.out.println("************************");

        writer.close();
    }

}


3)搜索

package com.numericrange;

import java.io.File;
import java.io.IOException;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.search.BooleanClause.Occur;
import org.apache.lucene.search.BooleanQuery;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.NumericRangeQuery;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopScoreDocCollector;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

public class NumericQueryDemo
{

    public static void main(String[] args) throws IOException, Exception
    {
        // Use Indexes from existing folder
        String dirPath = "/Users/Lucene/indexes";
        IndexReader reader = DirectoryReader.open(FSDirectory.open(new File(dirPath)));
        IndexSearcher searcher = new IndexSearcher(reader);

        Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_44);

        BooleanQuery bq = new BooleanQuery();
        bq.add(NumericRangeQuery.newIntRange("0", 100, 600, true, true), Occur.MUST);
        bq.add(NumericRangeQuery.newIntRange("1", 40, 700, true, true), Occur.MUST);
        bq.add(NumericRangeQuery.newIntRange("2", 500, 1000, true, true), Occur.MUST);
        bq.add(NumericRangeQuery.newIntRange("3", 300, 900, true, true), Occur.MUST);
        bq.add(NumericRangeQuery.newIntRange("4", 600, 800, true, true), Occur.MUST);
        System.out.println("Query Data:" + bq.toString());

        TopScoreDocCollector collector = TopScoreDocCollector.create(500, true);
        long startTime = System.currentTimeMillis();
        searcher.search(bq, collector);
        System.out.println("Search Time: "+(System.currentTimeMillis() - startTime)+"ms");

        // Display Results
        ScoreDoc[] hits = collector.topDocs().scoreDocs;
        System.out.println("Found " + hits.length + " hits.");
        for(int i=0; i 

4)搜索结果

Query Data:+0:[100 TO 600] +1:[40 TO 700] +2:[500 TO 1000] +3:[300 TO 900] +4:[600 TO 800]
Search Time: 27ms
Found 2 hits.
1. 2.236068 0 ==== 137 ==== 41 ==== 908 ==== 871 ==== 686
2. 2.236068 1 ==== 598 ==== 623 ==== 527 ==== 364 ==== 800


如您所见,我使用的是precisionStep值为'6'.我验证了文件通过Luke正确编入索引,并通过Luke解雇了相同的查询.

你能尝试通过Luke界面触发查询吗？根据您的文档更改值.

+0:[100至600] +1:[40至700] +2:[500至1000] +3:[300至900] +4:[600至800]

推荐阅读

text
Linux重启网络命令实例及关机和重启示例教程

本文介绍了Linux系统中重启网络命令的实例，以及使用不同方式关机和重启系统的示例教程。包括使用图形界面和控制台访问系统的方法，以及使用shutdown命令进行系统关机和重启的句法和用法。 ... [详细]

蜡笔小新 2023-12-14 15:52:52
char
PE总结9PE文件结构之解析导出表

本文介绍了PE文件结构中的导出表的解析方法，包括获取区段头表、遍历查找所在的区段等步骤。通过该方法可以准确地解析PE文件中的导出表信息。 ... [详细]

蜡笔小新 2023-12-13 11:47:24
char
深入浅出Linux设备驱动编程的重要性与方法

本文介绍了深入浅出Linux设备驱动编程的重要性，以及两种加载和删除Linux内核模块的方法。通过一个内核模块的例子，展示了模块的编译和加载过程，并讨论了模块对内核大小的控制。深入理解Linux设备驱动编程对于开发者来说非常重要。 ... [详细]

蜡笔小新 2023-12-12 15:28:09
char
CentOS 6.4更新源地址的方法

本文介绍了在CentOS 6.4系统中更新源地址的方法，包括备份现有源文件、下载163源、修改文件名、更新列表和系统，并提供了相应的命令。 ... [详细]

蜡笔小新 2023-12-11 16:09:40
main
解决.net项目中未注册“microsoft.ACE.oledb.12.0”提供程序的方法

在开发.net项目中，通过microsoft.ACE.oledb读取excel文件信息时，报错“未在本地计算机上注册“microsoft.ACE.oledb.12.0”提供程序”。本文提供了解决这个问题的方法，包括错误描述和代码示例。通过注册提供程序和修改连接字符串，可以成功读取excel文件信息。 ... [详细]

蜡笔小新 2023-12-11 15:08:02
hash
Hibernate延迟加载深入分析-集合属性的延迟加载策略

本文深入分析了Hibernate延迟加载的机制，特别是集合属性的延迟加载策略。通过延迟加载，可以降低系统的内存开销，提高Hibernate的运行性能。对于集合属性，推荐使用延迟加载策略，即在系统需要使用集合属性时才从数据库装载关联的数据，避免一次加载所有集合属性导致性能下降。 ... [详细]

蜡笔小新 2023-12-10 14:26:13
const
node . js urlsearchparams API

node.jsurlsearchparamsAPI哎哎哎 ... [详细]

蜡笔小新 2023-12-09 18:08:10
select
php缓存ri,浅析ThinkPHP缓存之快速缓存(F方法)和动态缓存(S方法)(日常整理)

thinkPHP的F方法只能用于缓存简单数据类型，不支持有效期和缓存对象。S()缓存方法支持有效期，又称动态缓存方法。本文是小编日常整理有关thinkp ... [详细]

蜡笔小新 2023-12-09 17:54:25
char
C语言自带的快排和二分查找

Author🚹:CofCaiEmail✉️:cai.dongjunnexuslink.cnQQ😙:1664866311personalPage&#x ... [详细]

蜡笔小新 2023-10-17 21:23:47
format
Winform獲得取得用程序的當前路徑的方法

Winform獲得取得用程序的當前路徑的方法zz(2011-03-2411:21:13)转载▼标签：c分类：学习Winform获取应用程序的当前路径的方 ... [详细]

蜡笔小新 2023-10-17 13:33:20
datetime
c#语言-多线程中的锁系统(一)

介绍平常在多线程开发中，总避免不了线程同步。本篇就对net多线程中的锁系统做个简单描述。目录一：lock、Monitor1：基础 ... [详细]

蜡笔小新 2023-10-16 17:56:14
main
vlfilecopy(findfile(vllist>string(10811110311146103105102)))(vll的简单介绍

本文目录一览：1、一段lisp代码求解释2、运 ... [详细]

蜡笔小新 2023-10-16 12:39:45
main
嵌入资源第三讲：多格式文件内嵌入WPF资源文件

作为一个扩展，你需要了解DotNetZip用法，请参见：C#.NET使用第三方类库DotNetZip解压压缩Zip文件你也需要了解单文件内嵌入资源文件基本方法，参见：WPF调用嵌入 ... [详细]

蜡笔小新 2023-10-16 12:36:37
select
PDO混合未命名和命名参数 - PDO mixing unnamed and named parameters

Imtryingtousethisforabasicsearchwithpagination:我正在尝试使用此分区进行基本搜索:$construct?AND? ... [详细]

蜡笔小新 2023-10-15 11:14:05
hash
phpgettext.dll的简单介绍

本文目录一览：1、在php.ini中设置了extension=php_gettext.dl ... [详细]

蜡笔小新 2023-10-13 12:18:00

你好cd_197

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章