solr6.3.0AdminUI查询中各参数的含义

2019独角兽企业重金招聘Python工程师标准>>>

本文内容是在官方文档给出的gettingstarted的Demo下进行的。如何启动运行官方demo"gettingstarted"可在公众号中历史文章中查看solr6.3.0的安装部署

AdminUI 中各参数及其含义

qt &＃61; query type

指定那个类型来处理查询请求&＃xff0c;一般不用指定&＃xff0c;默认是standard

q &＃61; query

查询字符串&＃xff0c;必须指定&＃xff0c;查询结果根据该参数指定的查询词被打分

fq &＃61; filter query

过滤查询&＃xff0c;在q的基础上进行过滤&＃xff0c;不影响打分

sort

根据查询结果的打分或者其他指明的特点进行排序。有两种排序升序&＃xff08;asc&＃xff09;&＃xff0c;降序&＃xff08;desc&＃xff09;&＃xff0c;不区分大小写。允许根据多个field排序&＃xff0c;用逗号分隔开。

NB&＃xff1a; 排序的field必须是索引的field&＃xff0c;同时field对应的type不能是multiValued的

start

结果从那一条记录开始查询

rows

查询多少条记录

定义返回记录的field

默认查找的字段。solr6.3.0默认df&＃61;_text_

通过solr的adminUI 中可以看到如下配置

在server/solr/gettingstarted/conf/managed-schema

文件最后一行有这样一行配置

默认所有的field都被copy 到_text_中。

用处&＃xff1a;比如一个电商的搜索api调用方大部分只期望搜索产品名称则df&＃61;product_name

指明返回数据格式。默认是json

indent

返回结果是否缩进。默认indent&＃61;on开启&＃xff0c;一般调试json,php,phps,ruby输出才有必要用这个参数

debugQuery

查询结果中包含调试信息。explain info中包含每一条查询结果的信息

更多详细信息参考&＃xff1a; http://www.solr.cc/blog/?p&＃61;1018

NB&＃xff1a;solr官方的例子中&＃xff0c;对price进行排序时需要修改server/solr/gettingstarted/conf/managed-schema文件中

改为

使用solr AdminUI进行查询

http://192.168.1.23:8983/solr/gettingstarted/select?df&＃61;_text_&fl&＃61;name,price,features,score&fq&＃61;manu:Belkin&indent&＃61;on&q&＃61;ipod&sort&＃61;price%20asc&wt&＃61;json

查询结果如图所示

相关性排序

solr与其他关系型数据库和NoSQL的区别之一&＃xff0c;是solr对返回的结果进行了查询词的相关性排序&＃xff0c;默认按照相关性降序排列。score越高&＃xff0c;查询词和文档的相关性就越高。

以gettingstarted为例&＃xff0c;使用不同的参数&＃xff0c;进行如下三次查询&＃xff1a;

query &＃xff1a; iPod

fl&＃xff1a;name,features,score

返回的结果按照score降序排列。直观的看&＃xff0c;第一条数据&＃xff0c;搜索词出现3次&＃xff0c;剩余的两条数据ipod只出现了一次。

score的值不是固定不变的。它仅用于lucence内部做相关性排序使用&＃xff0c;查询词不同&＃xff0c;分数也不同。

每一次查询时&＃xff0c;每一个文档会被计算出一个和查询词匹配的分数&＃xff0c;分数越高&＃xff0c;文档和查询词越相关。

query &＃xff1a; iPod power

fl&＃xff1a;name,features,score

查询结果与上次相同&＃xff0c;但是我们注意到&＃xff0c;打分不同

query &＃xff1a; iPod power^2

fl&＃xff1a;name,features,score

给power这个查询词设置一个2的权重&＃xff08;默认都是1&＃xff09;。这意味着&＃xff0c;power这个词比ipod这个词重要了一倍。现在看查询结果&＃xff0c;虽然查询来还是那3条结果&＃xff0c;但是顺序已经发生了变化。

翻页和排序

想一想&＃xff0c;你自己平时在淘宝上会翻到第几页&＃xff0c;99%的人按照某个条件拍个序&＃xff0c;然后从前几个总找一个&＃xff08;不过也真有一页一页往后翻的&＃xff09;。所以我们在做搜索时&＃xff0c;真的不需要返回全部的结果集。

olr使用rows和start两个属性&＃xff0c;进行分页。

在客户端发送一个查询请求给solr&＃xff0c;solr经过一系列的处理之后&＃xff0c;去索引库中找&＃xff0c;将找到的结果返回给solr&＃xff0c;solr在经过一系列的处理&＃xff0c;返回给客户端。执行过程如下&＃xff1a;

640?wx_fmt&＃61;png&tp&＃61;webp&wxfrom&＃61;5&wx_lazy&＃61;1

所以&＃xff1a;返回的结果越多&＃xff0c;重新组织需要的时间就越长

--排序--

在上面的图例中我们看到可以根据相关性&＃xff08;score&＃xff09;进行排序&＃xff0c;可以根据价格进行排序。排序和分页基本上一起使用&＃xff08;原文用的hand in hand意境好美&＃xff09;&＃xff0c;因为排序顺序决定分页的结果。

如果没有指定排序&＃xff0c;solr会根据score来进行排序。如果两个文档的打分相同&＃xff0c;他们会根据lucene的一个内部ID来排序。这个排序的值会随着索引

的变化而变化&＃xff0c;所以这个排序不可靠。

更多信息请关注微信公众号&＃xff1a;金沙数据

640?wx_fmt&＃61;jpeg&tp&＃61;webp&wxfrom&＃61;5&wx_lazy&＃61;1

solr6.3.0AdminUI查询中各参数的含义

Pikachu平台SQL注入漏洞详解

SQL Server 远程备份解决方案

Apache Axis2 403 Forbidden 错误分析与解决方案

开发笔记:异步实时搜索jquery select插件

淘宝大数据产品技术架构解析

如何获取php脚本路径(2023年最新解答)

深入理解HTTP协议及其数据包

SQL Server中查询表结构与视图的方法，便捷高效

解决MySQL Administrator 登录失败问题

浏览器、中间件与服务器的交互机制

SQL Server 并发控制：谓词锁对外部插入的影响

开发笔记:Mongodb副本集集群搭建

第四十章：基于SpringBoot & Quartz完成定时任务分布式多节点负载持久化

高效利用Java异常处理

CDH Web安装指南