热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

关于lucene搜索时排序的问题

为什么80%的码农都做不了架构师?在Lucene4.6中,想要实现搜索结果按照时间倒序的效果:如果两个文档得分相同,那

为什么80%的码农都做不了架构师?>>>   hot3.png

       在Lucene4.6中,想要实现搜索结果按照时间倒序的效果:如果两个文档得分相同,那么就按照发布时间倒序排列;否则就按照分数排列。这种效果在 Lucene4.6中实现起来极其简单,直接利用search接口的Sort参数即可达成,完全不需要像某些人说的重写Similarity那么麻烦。三 两行代码的事情,体现了Make it simple, stupid的精髓。

package com.hankcs.test; 
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.document.*;
import org.apache.lucene.index.*;
import org.apache.lucene.queries.CustomScoreQuery;
import org.apache.lucene.queries.function.FunctionQuery;
import org.apache.lucene.queryparser.classic.ParseException;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.*;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.LockObtainFailedException;
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.util.Version;import org.wltea.analyzer.lucene.IKAnalyzer; 
import java.io.IOException; 
/** * @author hankcs */
public class TestSortByTime{  public static void main(String[] args)    {   // Lucene Document的主要域名       String fieldName &#61; "text";      // 实例化IKAnalyzer分词器       Analyzer analyzer &#61; new IKAnalyzer();       Directory directory &#61; null;        IndexWriter iwriter;        IndexReader ireader &#61; null;        IndexSearcher isearcher;        try        {            //索引过程**********************************           //建立内存索引对象            directory &#61; new RAMDirectory();             //配置IndexWriterConfig            IndexWriterConfig iwConfig &#61; new IndexWriterConfig(Version.LUCENE_46, analyzer);  iwConfig.setOpenMode(IndexWriterConfig.OpenMode.CREATE_OR_APPEND);         iwriter &#61; new IndexWriter(directory, iwConfig);            //写入索引            for (int i &#61; 0; i < 3; &#43;&#43;i) {                int year &#61; 2004 &#43; i;                Document doc &#61; new Document();                doc.add(new TextField(fieldName, year &#43; "全民突击攻略", Field.Store.YES));doc.add(new IntField("date",  year * 10000 &#43; 1111, Field.Store.YES));             iwriter.addDocument(doc);}            // 加入一个干扰文档            Document doc &#61; new Document();            doc.add(new TextField(fieldName, "天天酷跑攻略", Field.Store.YES));            doc.add(new IntField("date",  20141111, Field.Store.YES));            iwriter.addDocument(doc);            iwriter.close();             //搜索过程**********************************            //实例化搜索器            ireader &#61; DirectoryReader.open(directory);            isearcher &#61; new IndexSearcher(ireader);             String keyword &#61; "全民突击攻略";            //使用QueryParser查询分析器构造Query对象            QueryParser qp &#61; new QueryParser(Version.LUCENE_46, fieldName, analyzer);         Query query &#61; qp.parse(keyword);            System.out.println("Query &#61; " &#43; query);             //搜索相似度最高的5条记录            Sort sort &#61; new Sort(new SortField("text", SortField.Type.SCORE), new SortField("date", SortField.Type.INT, true));            TopDocs topDocs &#61; isearcher.search(query, 5, sort);            System.out.println("命中&#xff1a;" &#43; topDocs.totalHits);           //输出结果            ScoreDoc[] scoreDocs &#61; topDocs.scoreDocs;            for (int i &#61; 0; i < Math.min(5, scoreDocs.length); i&#43;&#43;){                Document targetDoc &#61; isearcher.doc(scoreDocs[i].doc);                System.out.print(targetDoc.getField(fieldName).stringValue());                System.out.print(" , " &#43; targetDoc.getField("date").numericValue());                System.out.println(" , " &#43; scoreDocs[i].score);            }        } catch (CorruptIndexException e)        {           e.printStackTrace();        } catch (LockObtainFailedException e)        {            e.printStackTrace();        } catch (IOException e){            e.printStackTrace();        } catch (ParseException e)        {            e.printStackTrace();        } finally        {           if (ireader !&#61; null)  {try{                    ireader.close();                } catch (IOException e)                { e.printStackTrace();                } }           if (directory !&#61; null)            {    try                {       directory.close();             } catch (IOException e)                {e.printStackTrace();                }    }        }    }}



转:https://my.oschina.net/momei/blog/538241



推荐阅读
  • 如何使用Maven将依赖插件一并打包进JAR文件
    本文详细介绍了在使用Maven构建项目时,如何将所需的依赖插件一同打包进最终的JAR文件中,以避免手动部署依赖库的麻烦。 ... [详细]
  • 深入解析Android Activity生命周期
    本文详细探讨了Android中Activity的生命周期,通过实例代码和详细的步骤说明,帮助开发者更好地理解和掌握Activity各个阶段的行为。 ... [详细]
  • 本文详细探讨了 Java 中 com.codahale.metrics.servlets.AdminServlet.() 方法的实现与应用,并提供了多个实际项目中的代码示例,帮助开发者更好地理解和使用这一方法。 ... [详细]
  • 本文探讨了一个在Spring项目中常见的问题——当pom.xml文件中引入了servlet依赖但未指定其作用域为provided时导致的应用启动失败。文章详细分析了错误原因,并提供了有效的解决方案。 ... [详细]
  • Java实现实时更新的日期与时间显示
    本文介绍了如何使用Java编程语言来创建一个能够实时更新显示系统当前日期和时间的小程序。通过使用Swing库中的组件和定时器功能,可以实现界面友好且功能强大的时间显示应用。 ... [详细]
  • MVC框架下使用DataGrid实现时间筛选与枚举填充
    本文介绍如何在ASP.NET MVC项目中利用DataGrid组件增强搜索功能,具体包括使用jQuery UI的DatePicker插件添加时间筛选条件,并通过枚举数据填充下拉列表。 ... [详细]
  • 本文档提供了详细的MySQL安装步骤,包括解压安装文件、选择安装类型、配置MySQL服务以及设置管理员密码等关键环节,帮助用户顺利完成MySQL的安装。 ... [详细]
  • Struts2框架构建指南
    本文详细介绍了如何使用Struts2(版本2.3.16.3)构建Web应用,包括必要的依赖库添加、配置文件设置以及简单的示例代码。Struts2是Apache软件基金会下的一个开源框架,用于简化Java Web应用程序的开发。 ... [详细]
  • 本文介绍了在解决Hive表中复杂数据结构平铺化问题后,如何通过创建视图来准确计算广告日志的曝光PV,特别是针对用户对应多个标签的情况。同时,详细探讨了UDF的使用方法及其在实际项目中的应用。 ... [详细]
  • 近期在研究Java IO流技术时,遇到了一个关于如何正确读取Doc文档而不出现乱码的问题。本文将详细介绍使用Apache POI库处理Doc和Docx文件的具体方法,包括必要的库引入和示例代码。 ... [详细]
  • 本文探讨了在使用Apache HttpClient 4.x(作为commons-httpclient 3.x的后续版本)时,如何配置默认的HttpContext,以确保每次执行请求时无需显式传递上下文。 ... [详细]
  • 前端技术分享——利用Canvas绘制鼠标轨迹
    作为一名前端开发者,我已经积累了Vue、React、正则表达式、算法以及小程序等方面的技能,但Canvas一直是我的盲区。因此,我在2018年为自己设定了一个新的学习目标:掌握Canvas,特别是如何使用它来创建CSS3难以实现的动态效果。 ... [详细]
  • 本文详细介绍了跨站脚本攻击(XSS)的基本概念、工作原理,并通过实际案例演示如何构建XSS漏洞的测试环境,以及探讨了XSS攻击的不同形式和防御策略。 ... [详细]
  • 使用 ModelAttribute 实现页面数据自动填充
    本文介绍了如何利用 Spring MVC 中的 ModelAttribute 注解,在页面跳转后自动填充表单数据。主要探讨了两种实现方法及其背后的原理。 ... [详细]
  • 本文介绍了如何通过安装和配置php_uploadprogress扩展来实现文件上传时的进度条显示功能。通过一个简单的示例,详细解释了从安装扩展到编写具体代码的全过程。 ... [详细]
author-avatar
shahua1111
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有