Solr聚合统计stats

作者：海之蓝水之清清2011 | 来源：互联网 | 2023-06-28 11:26

简介stats查询用于对文档中的数字型、字符型和日期型字段进行简单的统计。stats设置为true，启用stat统计功能s

简介

stats查询用于对文档中的数字型、字符型和日期型字段进行简单的统计。
 stats
设置为true，启用stat统计功能
 stats.field
指定产生stat统计的字段，可以提供多个字段。
 stats.facet
在给定的facet字段中返回子结果
 支持的统计信息
min 最小值
max 最大值
sum 所有值之和
count 值的个数
missing 空值个数
mean 平均值

查询语法

输入：

q=apple&stats=true&stats.field=price&stats.field=popularity

输出统计信息：

0.0 2199.0 16 16 5251.270030975342 6038619.175900028 328.20437693595886 536.3536996709846 0.0 10.0 15 17 85.0 603.0 5.666666666666667 2.943920288775949

源码分析

（1）stats组件 /** * Stats component calculates simple statistics on numeric field values * @since solr 1.4 */ public class StatsComponent extends SearchComponent { public static final String COMPONENT_NAME = "stats"; @Override '''(a)准备阶段''' public void prepare(ResponseBuilder rb) throws IOException { '''根据参数stats=true设置功能开关''' if (rb.req.getParams().getBool(StatsParams.STATS,false)) { rb.setNeedDocSet( true ); rb.doStats = true; rb._statsInfo = new StatsInfo(rb); } } @Override '''(b)处理阶段''' public void process(ResponseBuilder rb) throws IOException { '''如果不需要统计，则返回''' if (!rb.doStats) return; '''保存统计结果的map''' Map statsValues = new LinkedHashMap<>(); '''循环处理“stats.field=price&stats.field=popularity”中每一个field''' for (StatsField statsField : rb._statsInfo.getStatsFields()) { '''一般情况，返回主查询语句q=apple的结果文档集''' DocSet docs = statsField.computeBaseDocSet(); '''getOutputKey()返回“price/popularity”作为key,computeLocalStatsValues()返回StatsValues的子类，比如NumericStatsValues/DateStatsValues/StringStatsValues/EnumStatsValues等 ''' statsValues.put(statsField.getOutputKey(), statsField.computeLocalStatsValues(docs)); } '''convertToResponse函数返回的结果即是2~25行的内容，计算统计值''' rb.rsp.add( "stats", convertToResponse(statsValues) ); } } public static NamedList>> convertToResponse (Map statsValues) { NamedList>> stats = new SimpleOrderedMap<>(); NamedList> stats_fields = new SimpleOrderedMap<>(); stats.add("stats_fields", stats_fields); '''遍历每一个StatsValues,调用getStatsValues计算统计值''' for (Map.Entry entry : statsValues.entrySet()) { String key = entry.getKey(); NamedList stv = entry.getValue().getStatsValues(); stats_fields.add(key, stv); } return stats; } } '''（2）AbstractStatsValues类负责各统计值的计算''' abstract class AbstractStatsValues implements StatsValues { '''返回key,value对,比如: min 0 max 2199.0 ...''' '''此处的min/max/count...等是所有StatsValues子类公共输出''' public NamedList getStatsValues() { NamedList res = new SimpleOrderedMap<>(); if (statsField.includeInResponse(Stat.min)) { res.add("min", min); } if (statsField.includeInResponse(Stat.max)) { res.add("max", max); } if (statsField.includeInResponse(Stat.count)) { res.add("count", count); } if (statsField.includeInResponse(Stat.missing)) { res.add("missing", missing); } if (statsField.includeInResponse(Stat.distinctValues)) { res.add("distinctValues", distinctValues); } if (statsField.includeInResponse(Stat.countDistinct)) { res.add("countDistinct", countDistinct); } if (statsField.includeInResponse(Stat.cardinality)) { if (statsField.getIsShard()) { res.add("cardinality", hll.toBytes()); } else { res.add("cardinality", hll.cardinality()); } } '''此函数由各子类覆盖，定义各自特殊的输出值''' addTypeSpecificStats(res); '''facet输出''' if (!facets.isEmpty()) { // add the facet stats NamedList> nl = new SimpleOrderedMap<>(); for (Map.Entry> entry : facets.entrySet()) { NamedList> nl2 = new SimpleOrderedMap<>(); nl.add(entry.getKey(), nl2); for (Map.Entry e2 : entry.getValue().entrySet()) { nl2.add(e2.getKey(), e2.getValue().getStatsValues()); } } res.add(FACETS, nl); } return res; } } '''（3）StatsValues子类数字型NumericStatsValues类''' class NumericStatsValues extends AbstractStatsValues { '''输出数字型特殊的特有的统计值sum, sumOfSquares, mean, stddev, and percentiles''' @Override protected void addTypeSpecificStats(NamedList res) { if (statsField.includeInResponse(Stat.sum)) { res.add("sum", sum); } if (statsField.includeInResponse(Stat.sumOfSquares)) { res.add("sumOfSquares", sumOfSquares); } if (statsField.includeInResponse(Stat.mean)) { res.add("mean", sum / count); } if (statsField.includeInResponse(Stat.stddev)) { res.add("stddev", getStandardDeviation()); } if (statsField.includeInResponse(Stat.percentiles)) { if (statsField.getIsShard()) { ByteBuffer buf = ByteBuffer.allocate(tdigest.byteSize()); // upper bound tdigest.asSmallBytes(buf); res.add("percentiles", Arrays.copyOf(buf.array(), buf.position()) ); } else { NamedList percentileNameList = new NamedList(); for (Double percentile : statsField.getPercentilesList()) { // Empty document set case if (tdigest.size() == 0) { percentileNameList.add(percentile.toString(), null); } else { Double cutoff = tdigest.quantile(percentile / 100); percentileNameList.add(percentile.toString(), cutoff); } } res.add("percentiles", percentileNameList); } } } }

推荐阅读

get
基于Linux开源VOIP系统LinPhone[四]

****************************************************************************************** ... [详细]

蜡笔小新 2024-11-12 11:00:11
go
解决Only fullscreen opaque activities can request orientation错误的方法

本文介绍了在使用PictureSelectorLight第三方框架时遇到的Only fullscreen opaque activities can request orientation错误，并提供了一种有效的解决方案。 ... [详细]

蜡笔小新 2024-11-13 09:46:25
int
将.o文件链接到.elf文件时

我有一个从C项目编译的.o文件，该文件引用了名为init_static_pool ... [详细]

蜡笔小新 2024-11-14 10:07:21
int
为什么多数程序员难以成为架构师？

探讨80%的程序员为何难以晋升为架构师，涉及技术深度、经验积累和综合能力等方面。本文将详细解析Tomcat的配置和服务组件，帮助读者理解其内部机制。 ... [详细]

蜡笔小新 2024-11-14 03:39:46
case
com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例

com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 10:47:33
case
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
list
解决Bootstrap DataTable Ajax请求重复问题

在最近的一个项目中，我们使用了JQuery DataTable进行数据展示，虽然使用起来非常方便，但在测试过程中发现了一个问题：当查询条件改变时，有时查询结果的数据不正确。通过FireBug调试发现，点击搜索按钮时，会发送两次Ajax请求，一次是原条件的请求，一次是新条件的请求。 ... [详细]

蜡笔小新 2024-11-12 13:59:27
split
优化Vite 1.0至2.0升级过程中遇到的某些代码块过大问题解决方案

本文详细探讨了在将项目从 Vite 1.0 升级到 2.0 的过程中，如何解决某些代码块过大的问题。通过具体的编码示例，文章提供了全面的解决方案，帮助开发者有效优化打包性能。 ... [详细]

蜡笔小新 2024-11-11 13:35:04
list
Flowable 流程图路径与节点展示：已执行节点高亮红色标记，增强可视化效果

在Flowable流程图中，通常仅显示当前节点，而路径则需自行获取。特别是在多次驳回的情况下，节点可能会出现混乱。本文重点探讨了如何准确地展示流程图效果，包括已结束的流程和正在执行的流程。具体实现方法包括生成带有高亮红色标记的图片，以增强可视化效果，确保用户能够清晰地了解每个节点的状态。 ... [详细]

蜡笔小新 2024-11-11 10:46:10
const
Android 构建基础流程详解

Android 构建基础流程详解 ... [详细]

蜡笔小新 2024-11-10 15:45:20
const
Spring框架中枚举参数的正确使用方法与技巧

本文详细阐述了在Spring Boot框架中正确使用枚举参数的方法与技巧，旨在帮助开发者更高效地掌握和应用枚举类型的数据传递，适合对Spring Boot感兴趣的读者深入学习。 ... [详细]

蜡笔小新 2024-11-09 20:34:17
spring
JavaWeb文件上传：前端实现与后端处理详解

在JavaWeb开发中，文件上传是一个常见的需求。无论是通过表单还是其他方式上传文件，都必须使用POST请求。前端部分通常采用HTML表单来实现文件选择和提交功能。后端则利用Apache Commons FileUpload库来处理上传的文件，该库提供了强大的文件解析和存储能力，能够高效地处理各种文件类型。此外，为了提高系统的安全性和稳定性，还需要对上传文件的大小、格式等进行严格的校验和限制。 ... [详细]

蜡笔小新 2024-11-11 19:50:46
int
HDU ACM 1073 Online Judge：基础字符串处理题目解析

### 优化后的摘要本文对 HDU ACM 1073 题目进行了详细解析，该题属于基础字符串处理范畴。通过分析题目要求，我们可以发现这是一道较为简单的题目。代码实现中使用了 C++ 语言，并定义了一个常量 `N` 用于字符串长度的限制。主要操作包括字符串的输入、处理和输出，具体步骤涉及字符数组的初始化和字符串的逆序操作。通过对该题目的深入探讨，读者可以更好地理解字符串处理的基本方法和技巧。 ... [详细]

蜡笔小新 2024-11-11 05:31:42
int
如何在Nginx服务器上轻松配置CertBot以实现SSL证书自动化管理

为了确保iOS应用能够安全地访问网站数据，本文介绍了如何在Nginx服务器上轻松配置CertBot以实现SSL证书的自动化管理。通过这一过程，可以确保应用始终使用HTTPS协议，从而提升数据传输的安全性和可靠性。文章详细阐述了配置步骤和常见问题的解决方法，帮助读者快速上手并成功部署SSL证书。 ... [详细]

蜡笔小新 2024-11-10 08:42:08
case
Android 源代码解析系列（一）：init.c 文件详解

本文详细解析了 Android 系统启动过程中的核心文件 `init.c`，探讨了其在系统初始化阶段的关键作用。通过对 `init.c` 的源代码进行深入分析，揭示了其如何管理进程、解析配置文件以及执行系统启动脚本。此外，文章还介绍了 `init` 进程的生命周期及其与内核的交互方式，为开发者提供了深入了解 Android 启动机制的宝贵资料。 ... [详细]

蜡笔小新 2024-11-10 00:35:48

海之蓝水之清清2011

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章