当前位置: 开发笔记 > 数据库 > 正文

与Elasticsearch相比，ApachePinot如何索引数据？

作者：他给我留下的美好_813 | 来源：互联网 | 2023-07-02 20:23

Elasticsearch和Pinot都在内部使用ApacheLucene。他们的索引策略有何不同？PS我完全有效的答案由于一个糟糕的问题而被删除，因为它是“基于

Elasticsearch 和 Pinot 都在内部使用 Apache Lucene。他们的索引策略有何不同？

PS 我完全有效的答案由于一个糟糕的问题而被删除，因为它是“基于意见的”。因此，发布带有有效问题的答案，以便它对社区有用。

回答

Apache Pinot 和 Elasticsearch 解决了不同的问题。

Elasticsearch 是一个用于全文搜索、模糊查询、搜索词自动完成等的搜索引擎。它使用一种叫做倒排索引的东西来实现这一点。传统的索引使用排序索引，其中文档存储为键，关键字存储为值。在这种情况下，查询延迟会非常高，因为需要搜索整个文档。但是在倒排索引中，关键字存储为键，文档 ID 存储为值。在这里，由于只需要搜索搜索关键字，查询延迟会非常低。因此，Elasticsearch 使用倒排索引来解决其核心目的，即“搜索”。

Apache Pinot 不是为“搜索”而构建的。它是为实时分析而构建的。它使用一种叫做星树索引的东西，它类似于数据所有维度的所有组合的预聚合值存储。如您所见，Apache Pinot 对数据的聚合派生/减少感兴趣，而不是数据本身。它使用这些预先聚合的值来提供对数据的极低延迟的实时分析。

Apache Pinot 的一个非常重要的用例是计算实时每个用户级别的分析并呈现面向每个用户的实时仪表板。Elasticsearch 也可以使用 Kibana 呈现实时仪表板，但由于它使用倒排索引方法，因此不适用于每用户级别的分析，因为这会给服务器带来巨大的负载，并且需要大量的弹性实例。由于这个上限，Elasticsearch 不适合每个用户级别的分析。

因此，如果您希望在您的应用程序中具有搜索功能以及每用户级别的分析，最好的方法是让 Elasticsearch 和 Pinot 消费者通过并行管道从同一个 Kafka 主题中摄取数据。这样，当 Elasticsearch 为搜索目的索引数据时，Pinot 将处理数据以进行每个用户级别的分析。

推荐阅读

elasticsearch
构建Filebeat-Kafka-Logstash-ElasticSearch-Kibana日志收集体系

本文介绍了如何使用Filebeat、Kafka、Logstash、ElasticSearch和Kibana构建一个高效、可扩展的日志收集与分析系统。各组件分别承担不同的职责，确保日志数据能够被有效收集、处理、存储及可视化。 ... [详细]

蜡笔小新 2024-12-08 14:48:22
elasticsearch
58同城的Elasticsearch应用与平台构建实践

本文由58同城高级架构师于伯伟分享，由陈树昌编辑整理，内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用，特别是在58同城的实施案例，包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]

蜡笔小新 2024-12-11 19:31:21
elasticsearch
Elasticsearch (ES) 基础概念解析

本文介绍了Elasticsearch (ES)，这是一个基于Java开发的开源全文搜索引擎。ES通过JSON接口提供服务，支持分布式集群管理和索引功能，特别适合大规模数据的快速搜索与分析。 ... [详细]

蜡笔小新 2024-12-06 18:41:45
elasticsearch
精通Spring Cloud：从入门到实践的全面指南

Spring Cloud因其强大的功能和灵活性，被誉为开发分布式系统的‘一站式’解决方案。它不仅简化了分布式系统中的常见模式实现，还被广泛应用于企业级生产环境中。本书内容详实，覆盖了从微服务基础到Spring Cloud的高级应用，适合各层次的开发者。 ... [详细]

蜡笔小新 2024-12-16 16:21:23
elasticsearch
优化Kafka流状态存储查询的最佳实践

本文探讨了如何优化和正确配置Kafka Streams应用程序以确保准确的状态存储查询。通过调整配置参数和代码逻辑，可以有效解决数据不一致的问题。 ... [详细]

蜡笔小新 2024-12-26 18:17:14
json
Solr的安装与部署指南

Solr作为一款独立的企业级搜索应用服务器，支持Web-service风格的API接口，允许用户通过HTTP请求提交XML文件以创建索引或执行搜索操作。本文将详细介绍Solr的安装步骤及配置方法。 ... [详细]

蜡笔小新 2024-12-08 14:24:55
数据库
分布式检索系统的简单设计

（1）XML预处理读取test.xml并修改url节点下的localhost信息，以保证预览和下载用户所需正确资源。过程如下： ... [详细]

蜡笔小新 2024-10-21 19:52:54
sql
datetime 索引_【免费毕设】ASP.NET基于Ajax+Lucene构建搜索引擎的设计和实现(源代码+论文)...

点击上方“蓝字”关注我们目录系统设计4.1搜索引擎模型模型包括爬虫、索引生成、查询以及系统配置部分。爬虫包括：网页抓取模块、网页减肥模块、爬虫维持模块。索引生成包括& ... [详细]

蜡笔小新 2024-10-09 12:30:45
hbase
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
mysql
开源软件：新时代的商业机遇与挑战

在哈佛大学商学院举行的Cyberposium大会上，专家们深入探讨了开源软件的崛起及其对企业市场的影响。会议指出，开源软件不仅为企业提供了新的增长机会，还促进了软件质量的提升和创新。 ... [详细]

蜡笔小新 2024-12-27 14:49:56
mysql
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
mysql
360SRC安全应急响应：从漏洞提交到修复的全过程

本文详细介绍了360SRC平台处理一起关键安全事件的过程，涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例，展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]

蜡笔小新 2024-12-27 11:10:05
数据库
深入解析 Apache Shiro 安全框架架构

本文详细介绍了 Apache Shiro，一个强大且灵活的开源安全框架。Shiro 专注于简化身份验证、授权、会话管理和加密等复杂的安全操作，使开发者能够更轻松地保护应用程序。其核心目标是提供易于使用和理解的API，同时确保高度的安全性和灵活性。 ... [详细]

蜡笔小新 2024-12-25 16:03:57
数据库
提升网站安全性：隐藏Apache、Nginx和PHP版本号的详细指南

本文详细介绍如何通过修改配置文件来隐藏Apache、Nginx和PHP的版本号，从而增强网站的安全性。我们将提供具体的配置步骤，并解释这些设置的重要性。 ... [详细]

蜡笔小新 2024-12-24 10:21:12
数据库
Spring Boot与Graylog集成实现微服务日志聚合与分析

本文介绍了如何在Graylog中配置输入源，并详细说明了Spring Boot项目中集成Graylog的日志聚合和分析方法，包括logback.xml的多环境配置。 ... [详细]

蜡笔小新 2024-11-17 11:47:30

他给我留下的美好_813

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章