当前位置: 开发笔记 > 编程语言 > 正文

solr查询id不等于_Solr常用的查询参数

作者：小艾的沙滩 | 来源：互联网 | 2023-06-29 15:55

在Solr中几个查询解析器可以共享由Solr支持的查询参数。以下部分描述了Solr中常见的查询参数，SearchRequestHandlers支持这些参数。defTy

在 Solr 中几个查询解析器可以共享由 Solr 支持的查询参数。

以下部分描述了 Solr 中常见的查询参数&＃xff0c;Search RequestHandlers 支持这些参数。

defType 参数

defType 参数选择 Solr 应该用来处理请求中的主查询参数(q)的查询解析器。例如&＃xff1a;

defType&＃61;dismax

如果没有指定 defType 参数&＃xff0c;则默认使用标准查询解析器。(如&＃xff1a;defType&＃61;lucene)

sort 参数

sort 参数按升序 (asc) 或降序 (desc) 顺序排列搜索结果。该参数可以与数字或字母内容一起使用。方向可以全部以小写字母或全部大写字母输入(即&＃xff0c;asc 或者ASC)。

Solr 可以根据文档分数或具有单个值的任何字段的值对查询响应进行排序&＃xff0c;该字段具有索引或使用 DocValues 的单个值(即任何字段&＃xff0c;它在架构属性包括multiValued&＃61;"false"&＃xff0c;要么 docValues&＃61;"true" 或 indexed&＃61;"true"- 如果该字段没有启用 DocValues&＃xff0c;则使用索引术语在运行时以动态方式生成它们)&＃xff0c;条件是&＃xff1a;

该字段是非标记化的(即&＃xff0c;该字段没有分析器&＃xff0c;并且其内容已经被解析为标记&＃xff0c;这会使排序不一致)&＃xff0c;或者

该字段使用仅生成一个词的分析器(如 KeywordTokenizer)。

如果您希望能够对要标记其内容的字段进行排序以便于搜索&＃xff0c;请使用架构中的 copyField 指令克隆该字段。然后在该字段上搜索并对其克隆进行排序。

该表说明 Solr 如何响应 sort 参数的各种设置&＃xff1a;

例

结果

如果省略了 sort 参数&＃xff0c;则执行排序就好像将该参数设置为 scoredesc

score desc

从最高分到最低分按降序排列

price asc

按 price 字段的升序排序

inStock desc&＃xff0c;price asc

按降序排列inStock字段的内容&＃xff0c;然后按照 price 字段的内容升序排序

关于 sort 参数的参数&＃xff1a;

排序顺序必须包含一个字段名称(或作为伪字段的 score)&＃xff0c;后跟空格(在 URL 字符串中转义为 &＃43; 或 %20)&＃xff0c;然后是排序方向(asc 或 desc)。

多个排序顺序可以用逗号隔开&＃xff0c;使用下面的语法&＃xff1a;sort&＃61;,],…

如果提供了多个排序标准&＃xff0c;则只有在第一个条目产生并列时才使用第二个条目。如果有第三个条目&＃xff0c;则只有在第一个和第二个条目是并列的情况下才能使用。这种模式会在之后的条目中继续。

start 参数

指定时&＃xff0c;start 参数指定查询结果集中的偏移量&＃xff0c;并指示 Solr 开始显示此偏移量的结果。

默认值是 0。换句话说&＃xff0c;默认情况下&＃xff0c;Solr 返回的结果没有偏移量&＃xff0c;从结果开始的地方开始。

将该 start 参数设置为某个其他数字(例如3&＃xff0c;)会导致 Solr 跳过前面的记录&＃xff0c;并从由偏移量标识的文档开始。

您可以使用这个 start 参数来进行分页。例如&＃xff0c;如果 rows 参数设置为10&＃xff0c;则可以通过将 start 设置为0来显示3个连续的结果页面&＃xff0c;然后重新发出相同的查询并将 start 设置为10&＃xff0c;然后再次发出查询并将 start 设置为 20。

rows 参数

您可以使用该 rows 参数将查询的结果分页。该参数指定 Solr 应该一次返回到客户端的完整结果集中的最大文档数目。

默认值是10。也就是说&＃xff0c;默认情况下&＃xff0c;Solr 一次返回 10 个文档以响应查询。

fq(Filter Query)参数

fq 参数定义了一个查询&＃xff0c;可以用来限制可以返回的文档的超集&＃xff0c;而不影响 score。这对于加快复杂查询非常有用&＃xff0c;因为指定的查询 fq 是独立于主查询而被缓存的。当以后的查询使用相同的过滤器时&＃xff0c;会有一个缓存命中&＃xff0c;过滤器结果从缓存中快速返回。

使用该 fq 参数时&＃xff0c;请记住以下几点&＃xff1a;

该 fq 参数可以在查询中多次指定。如果文档位于参数的每个实例所产生的文档集的交集中&＃xff0c;则文档将仅包含在结果中。在下面的例子中&＃xff0c;只有流行度大于10并且段落为0的文档才会匹配。fq&＃61;popularity:[10 TO *]&fq&＃61;section:0

filter 查询可能涉及复杂的 Boolean 查询。上面的例子也可以写成一个单独 fq 的两个强制性的子句&＃xff0c;如下所示&＃xff1a;fq&＃61;&＃43;popularity:[10 TO *] &＃43;section:0

每个过滤器查询的文档集都是独立缓存的。因此&＃xff0c;关于前面的例子&＃xff1a;如果这些条款经常出现在一起&＃xff0c;则使用一个包含两个强制性条款的单个 fq&＃xff0c;如果它们相对独立&＃xff0c;则使用两个单独的 fq 参数。(要了解调整高速缓存大小并确保过滤器缓存是实际存在的&＃xff0c;请参阅“良好配置的 Solr 实例”。)

还可以在 fq 内部使用 filter(condition) 语法来单独缓存子句&＃xff0c; 以及在其他情况下&＃xff0c;实现缓存的筛选器查询的联合。

与所有参数一样&＃xff1a;URL 中的特殊字符需要正确转义并编码为十六进制值。在线工具可以帮助您使用 URL 编码。例如&＃xff1a;http : //meyerweb.com/eric/tools/dencoder/。

fl(Field List)参数

该 fl 参数将查询响应中包含的信息限制在指定的字段列表中。这些字段必须是 stored&＃61;"true" 或 docValues&＃61;"true"。

字段列表可以指定为空格分隔或逗号分隔的字段名称列表。字符串“score”可以用来表示特定查询的每个文档的分数应该作为字段返回。通配符 * 选择文档中的所有字段&＃xff0c;它们是 stored&＃61;"true"、docValues&＃61;"true" 和 useDocValuesAsStored&＃61;"true"(当启用 docValues 时&＃xff0c;这是默认字段)。您还可以添加伪字段(pseudo-fields)、函数和变换器到字段列表请求。

本表显示了如何使用 fl 参数的一些基本示例&＃xff1a;

字段列表(Field List)

结果

id name price

仅返回 ID&＃xff0c;name 和 price 字段。

id,name,price

仅返回 ID&＃xff0c;name 和 price 字段。

id name, price

仅返回 ID&＃xff0c;name 和 price 字段。

id score

返回 id 字段和 score。

返回每个文档中的所有 stored 字段&＃xff0c;以及任何 useDocValuesAsStored&＃61;"true"的docValues字段。这是 fl 参数的默认值。

* score

返回每个文档中的所有字段以及每个字段的 score。

*,dv_field_name

返回每个文档中的所有stored字段&＃xff0c;以及任何具有 useDocValuesAsStored &＃61;“true” 的 docValues 字段和来自 dv_field_name 的 docValues&＃xff0c;即使它具有useDocValuesAsStored &＃61;“false”。

函数与 fl

可以为结果中的每个文档计算函数&＃xff0c;并将其作为伪字段(pseudo-field)返回&＃xff1a;fl&＃61;id,title,product(price,popularity)

文件变换器与 fl

文档变换器可以用来修改查询结果中每个文档返回的信息&＃xff1a;fl&＃61;id,title,[explain]

字段名称别名

您可以通过使用 “displayName” 前缀来更改对字段、函数或转换器的响应中使用的键。例如&＃xff1a;fl&＃61;id,sales_price:price,secret_sauce:prod(price,popularity),why_score:[explain style&＃61;nl]{

"response": {

"numFound": 2,

"start": 0,

"docs": [{

"id": "6H500F0",

"secret_sauce": 2100.0,

"sales_price": 350.0,

"why_score": {

"match": true,

"value": 1.052226,

"description": "weight(features:cache in 2) [DefaultSimilarity], result of:",

"details": [{

"..."

}]}}]}}

debug 参数

该 debug 参数可以多次指定&＃xff0c;并支持以下参数&＃xff1a;

debug&＃61;query&＃xff1a;仅返回有关查询的调试信息。

debug&＃61;timing&＃xff1a;返回有关查询花费多长时间处理的调试信息。

debug&＃61;results&＃xff1a;返回关于 score 结果的调试信息(也称为“解释”)。默认情况下&＃xff0c;score 解释以大字符串值的形式返回&＃xff0c;对结构和可读性使用换行符和制表符缩进行&＃xff0c;但是可以指定一个附加参数 debug.explain.structured&＃61;true 来将此信息作为 wt 请求的响应格式的嵌套数据结构返回。

debug&＃61;all&＃xff1a;返回关于 request 请求的所有可用调试信息。(可替代地使用&＃xff1a;debug&＃61;true)

为了向后兼容老版本的 Solr&＃xff0c;debugQuery&＃61;true 可以将其指定为另一种指示方式 debug&＃61;all。

默认行为是不包含调试信息。

explainOther参数

该 explainOther 参数指定了一个 Lucene 查询来标识一组文档。如果包含此参数并设置为非空值&＃xff0c;则查询将返回调试信息以及与 Lucene 查询相匹配的每个文档的“说明信息”(相对于主查询(由 q 指定)参数)。例如&＃xff1a;q&＃61;supervillians&debugQuery&＃61;on&explainOther&＃61;id:juggernaut

上面的查询允许您检查顶级匹配文档的评分解释信息&＃xff0c;将其与 id:juggernaut 文档匹配的解释信息进行比较&＃xff0c;并确定排名不符合您的期望的原因。

这个参数的默认值是空的&＃xff0c;这不会导致返回额外的“解释信息”。

timeAllowed 参数

此参数指定允许搜索完成的时间量(以毫秒为单位)。如果此时间在搜索完成之前到期&＃xff0c;任何部分结果将返回&＃xff0c;但如 numFound、facet 数和结果的统计的值可能对整个结果集不准确。

此值仅在以下时间检查&＃xff1a;

查询扩展(Query Expansion)

文件收集()Document collection

由于此检查是周期性执行的&＃xff0c;因此在中止请求之前处理请求的实际时间将略微大于或等于 timeAllowed 的值。如果请求在其他阶段中花费更多时间&＃xff0c;自定义组件等&＃xff0c;则不希望此参数中止请求。

segmentTerminateElely 参数

该参数可以设置为 true 或 false。

如果设置为 true&＃xff0c;并且如果此集合的 mergePolicyFactory 是 SortingMergePolicyFactory(使用的 sort 选项与此查询指定的 sort 参数兼容)&＃xff0c;则 Solr 将尝试使用 EarlyTerminatingSortingCollector。

如果提前终止(early termination)使用&＃xff0c;一个 segmentTerminatedEarly 标题将包含在 responseHeader。

使用类似的 timeAllowed &＃96;Parameter, 当早期段终止发生时&＃xff0c;例如值 &＃96;numFound&＃xff0c;Facet 计数&＃xff0c;并导致 Stats 可能不准确对整个结果集。

这个参数的默认值是 false。

omitHeader 参数

该参数可以设置为 true 或 false。

如果设置为 true&＃xff0c;则此参数将从返回的结果中排除标题。标题包含有关请求的信息&＃xff0c;例如完成所需的时间。该参数的默认值是 false。

wt 参数

该 wt 参数选择 Solr 应该用来格式化查询响应的 Response Writer。有关响应写入程序的详细说明&＃xff0c;请参阅响应写入程序。

如果您没有在查询中定义 wt 参数&＃xff0c;那么 JSON 将作为响应的格式返回。

cache参数

Solr 默认缓存所有查询的结果并过滤查询。要禁用结果缓存&＃xff0c;请设置 cache&＃61;false 参数。

您也可以使用该 cost 选项来控制计算非缓存筛选器查询的顺序。这使您可以在昂贵的非缓存过滤器之前订购更便宜的非缓存过滤器。

对于成本非常高的过滤器&＃xff0c;如果 cache&＃61;falseand 并且 cost>&＃61;100 和查询实现了 PostFilter 接口&＃xff0c;则将从该查询请求收集器&＃xff0c;并在匹配主查询和所有其他过滤器查询后用于过滤文档。可以有多个后置过滤器&＃xff1b;他们也按成本排序。

例如&＃xff1a;

这是一个正常的函数范围查询&＃xff0c;用作过滤器&＃xff0c;所有匹配的文件都是预先生成和缓存的&＃xff1a;fq&＃61;{!frange l&＃61;10 u&＃61;100}mul(popularity,price)

这是一个与传统的 lucene 过滤器并行运行的函数范围查询&＃xff1a;fq&＃61;{!frange l&＃61;10 u&＃61;100 cache&＃61;false}mul(popularity,price)

这是在每个已经匹配查询和所有其他过滤器的文档之后检查的函数范围查询。这对于非常昂贵的函数查询是很好的&＃xff1a;fq&＃61;{!frange l&＃61;10 u&＃61;100 cache&＃61;false cost&＃61;100}mul(popularity,price)

logParamsList 参数

默认情况下&＃xff0c;Solr 记录请求的所有参数。设置此参数以限制请求的哪些参数被记录。这可能有助于将日志记录控制为仅对贵组织认为重要的参数。

例如&＃xff0c;你可以像这样定义&＃xff1a;logParamsList&＃61;q,fq

只有 &＃39;q&＃39; 和 &＃39;fq&＃39; 参数会被记录。

如果没有参数应该被记录&＃xff0c;你可以发送 logParamsList 为空(即&＃xff0c;logParamsList&＃61;)。

Tip&＃xff1a;这个参数不仅适用于查询请求&＃xff0c;而且适用于 Solr 的任何类型的请求。

echoParams 参数

该 echoParams 参数控制响应头中包含的有关请求参数的信息。

该 echoParams 参数接受以下值&＃xff1a;explicit&＃xff1a;这是默认值。只有实际请求中包含的参数以及 _参数(这是一个 64 位数字时间戳)将被添加到响应头的 params 部分。

all&＃xff1a;包含对查询作出贡献的所有请求参数。这将包括在 solrconfig.xml 中找到的请求处理程序定义中定义的所有内容以及请求中包含的参数以及 _参数。如果参数包含在请求处理程序定义和请求中&＃xff0c;则它将在响应头中出现多次。

none&＃xff1a;完全删除响应头的 “params” 部分。在响应中没有关于请求参数的信息。

下面是一个 JSON 响应的例子&＃xff0c;其中没有包含 echoParams 参数&＃xff0c;所以缺省值 explicit 是活动的。创建此响应的请求的 URL 包括三个参数 - q&＃xff0c;wt 和 indent&＃xff1a;{

"responseHeader": {

"status": 0,

"QTime": 0,

"params": {

"q": "solr",

"indent": "true",

"wt": "json",

"_": "1458227751857"

}

"response": {

"numFound": 0,

"start": 0,

"docs": []

}

如果发送了一个类似的请求&＃xff0c;并添加 echoParams&＃61;all 到前面示例中使用的三个参数中&＃xff0c;则会发生这种情况&＃xff1a;{

"responseHeader": {

"status": 0,

"QTime": 0,

"params": {

"q": "solr",

"df": "text",

"preferLocalShards": "false",

"indent": "true",

"echoParams": "all",

"rows": "10",

"wt": "json",

"_": "1458228887287"

}

"response": {

"numFound": 0,

"start": 0,

"docs": []

}

推荐阅读

io
深入探索HTTP协议的学习与实践

在初次访问某个网站时，由于本地没有缓存，服务器会返回一个200状态码的响应，并在响应头中设置Etag和Last-Modified等缓存控制字段。这些字段用于后续请求时验证资源是否已更新，从而提高页面加载速度和减少带宽消耗。本文将深入探讨HTTP缓存机制及其在实际应用中的优化策略，帮助读者更好地理解和运用HTTP协议。 ... [详细]

蜡笔小新 2024-11-09 10:12:07
version
HTTP header 介绍

HTTP(HyperTextTransferProtocol)是超文本传输协议的缩写，它用于传送www方式的数据。HTTP协议采用了请求响应模型。客服端向服务器发送一 ... [详细]

蜡笔小新 2024-11-14 09:13:00
function
Native与HTML5交互基础教程

本文将介绍如何在混合开发（Hybrid）应用中实现Native与HTML5的交互，包括基本概念、学习目标以及具体的实现步骤。 ... [详细]

蜡笔小新 2024-11-14 12:33:11
sum
浅析python实现布隆过滤器及Redis中的缓存穿透原理_python

本文带你了解了位图的实现，布隆过滤器的原理及Python中的使用，以及布隆过滤器如何应对Redis中的缓存穿透，相信你对布隆过滤 ... [详细]

蜡笔小新 2024-11-13 16:43:07
cookie
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
list
如何优化MySQL数据库性能以提升查询效率和系统稳定性

如何优化MySQL数据库性能以提升查询效率和系统稳定性 ... [详细]

蜡笔小新 2024-11-09 13:48:51
list
Web开发框架概览：Java与JavaScript技术及框架综述

Web开发涉及服务器端和客户端的协同工作。在服务器端，Java是一种优秀的编程语言，适用于构建各种功能模块，如通过Servlet实现特定服务。客户端则主要依赖HTML进行内容展示，同时借助JavaScript增强交互性和动态效果。此外，现代Web开发还广泛使用各种框架和库，如Spring Boot、React和Vue.js，以提高开发效率和应用性能。 ... [详细]

蜡笔小新 2024-11-09 11:59:38
list
SpringMVC 入门指南：快速上手 Java Web 开发

本文将带你快速了解 SpringMVC 框架的基本使用方法，通过实现一个简单的 Controller 并在浏览器中访问，展示 SpringMVC 的强大与简便。 ... [详细]

蜡笔小新 2024-11-13 14:22:01
list
用阿里云的免费 SSL 证书让网站从 HTTP 换成 HTTPS

HTTP协议是不加密传输数据的，也就是用户跟你的网站之间传递数据有可能在途中被截获，破解传递的真实内容，所以使用不加密的HTTP的网站是不 ... [详细]

蜡笔小新 2024-11-13 14:02:50
list
在PHP中如何正确调用JavaScript变量及定义PHP变量的方法详解

在PHP中如何正确调用JavaScript变量及定义PHP变量的方法详解 ... [详细]

蜡笔小新 2024-11-11 17:28:29
cookie
DVWA学习笔记系列：深入理解CSRF攻击机制

DVWA学习笔记系列：深入理解CSRF攻击机制 ... [详细]

蜡笔小新 2024-11-11 13:19:51
io
如何使用 `org.apache.tomcat.websocket.server.WsServerContainer.findMapping()` 方法及其代码示例解析

如何使用 `org.apache.tomcat.websocket.server.WsServerContainer.findMapping()` 方法及其代码示例解析 ... [详细]

蜡笔小新 2024-11-11 10:08:55
version
优化Hadoop 2.7.2源代码以支持Snappy压缩和解压功能的Native编译

为了在Hadoop 2.7.2中实现对Snappy压缩和解压功能的原生支持，本文详细介绍了如何重新编译Hadoop源代码，并优化其Native编译过程。通过这一优化，可以显著提升数据处理的效率和性能。此外，还探讨了编译过程中可能遇到的问题及其解决方案，为用户提供了一套完整的操作指南。 ... [详细]

蜡笔小新 2024-11-09 19:45:36
sum
C#实现文件的压缩与解压

2019独角兽企业重金招聘Python工程师标准一、准备工作1、下载ICSharpCode.SharpZipLib.dll文件2、项目中引用这个dll二、文件压缩与解压共用类 ... [详细]

蜡笔小新 2024-11-14 10:37:34
io
深入解析NoSQL数据库：键值对、文档、列式存储与图数据库的应用与特点

本文深入探讨了NoSQL数据库的四大主要类型：键值对存储、文档存储、列式存储和图数据库。NoSQL（Not Only SQL）是指一系列非关系型数据库系统，它们不依赖于固定模式的数据存储方式，能够灵活处理大规模、高并发的数据需求。键值对存储适用于简单的数据结构；文档存储支持复杂的数据对象；列式存储优化了大数据量的读写性能；而图数据库则擅长处理复杂的关系网络。每种类型的NoSQL数据库都有其独特的优势和应用场景，本文将详细分析它们的特点及应用实例。 ... [详细]

蜡笔小新 2024-11-09 14:47:28

小艾的沙滩

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章