热门标签 | HotTags
当前位置:  开发笔记 > 前端 > 正文

ElasticSearch(全文检索--倒排索引)(es倒排索引数据结构)

本文主要分享【es倒排索引数据结构】,技术文章【ElasticSearch(全文检索--倒排索引)】为【perfect-ws】投稿,如果你遇到ElasticSerach相关问题,本文相关知识或能到你。

本文主要分享【es倒排索引数据结构】,技术文章【ElasticSearch(全文检索--倒排索引)】为【perfect-ws】投稿,如果你遇到ElasticSerach相关问题,本文相关知识或能到你。

es倒排索引数据结构

ElasticSearch(全文检索–倒排索引)

参考:https://blog.csdn.net/young_1004/article/details/83049412

整体结构 集群

img

节点

img

索引–index–重点

由一个或者多个节点,多个绿色小方块组合在一起形成的ElasticSearch的索引

img

分片–shard

img

一个分片就是一个Lucene index

img

每个Lucene里面有很多Segment–Segment为最小管理单元

 img

倒排索引

img

ElasticSearch是以文档为最小单位的搜索引擎的索引其实就是实现单词–文档矩阵的具体数据结构,可以有多种不同的方式来实现上述概念模型,比如“倒排索引”,“签名文件”等方式,但是倒排索引是最佳实现方式

倒排索引是实现“单词-文档矩阵”的一种具体存储形式,通过倒排索引,可以根据单词快速获取包含这个单词的文档列表。倒排索引主要由两个部分组成:“单词词典”和“倒排文件”。

倒排索引实例

将第一张文档的数据,转换成第二个图片的索引过程

ElasticSearch(全文检索--倒排索引)(es倒排索引数据结构)


ElasticSearch(全文检索--倒排索引)(es倒排索引数据结构)

名词:

文档:一般搜索引擎的处理对象是互联网网页,文档这个概念要更宽泛代表以文档形式存在的存储对象,如word,pdf,htmlmxml等不同格式的文件,再比如一封邮件,一条微博也可以称为文档

的存储对象,如word,pdf,htmlmxml等不同格式的文件,再比如一封邮件,一条微博也可以称为文档

本文《ElasticSearch(全文检索--倒排索引)》版权归perfect-ws所有,引用ElasticSearch(全文检索--倒排索引)需遵循CC 4.0 BY-SA版权协议。


推荐阅读
  • Spring Boot与Graylog集成实现微服务日志聚合与分析
    本文介绍了如何在Graylog中配置输入源,并详细说明了Spring Boot项目中集成Graylog的日志聚合和分析方法,包括logback.xml的多环境配置。 ... [详细]
  • 全面解析运维监控:白盒与黑盒监控及四大黄金指标
    本文深入探讨了白盒和黑盒监控的概念,以及它们在系统监控中的应用。通过详细分析基础监控和业务监控的不同采集方法,结合四个黄金指标的解读,帮助读者更好地理解和实施有效的监控策略。 ... [详细]
  • 本文介绍了Elasticsearch (ES),这是一个基于Java开发的开源全文搜索引擎。ES通过JSON接口提供服务,支持分布式集群管理和索引功能,特别适合大规模数据的快速搜索与分析。 ... [详细]
  • (1)XML预处理读取test.xml并修改url节点下的localhost信息,以保证预览和下载用户所需正确资源。过程如下: ... [详细]
  • PyCharm下载与安装指南
    本文详细介绍如何从官方渠道下载并安装PyCharm集成开发环境(IDE),涵盖Windows、macOS和Linux系统,同时提供详细的安装步骤及配置建议。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 360SRC安全应急响应:从漏洞提交到修复的全过程
    本文详细介绍了360SRC平台处理一起关键安全事件的过程,涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例,展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]
  • 离线环境下的Python及其第三方库安装指南
    在项目开发中,有时会遇到电脑只能连接内网或完全无法联网的情况。本文将详细介绍如何在这种环境下安装Python及其所需的第三方库,确保开发工作的顺利进行。 ... [详细]
  • 本文详细介绍了macOS系统的核心组件,包括如何管理其安全特性——系统完整性保护(SIP),并探讨了不同版本的更新亮点。对于使用macOS系统的用户来说,了解这些信息有助于更好地管理和优化系统性能。 ... [详细]
  • 使用Vultr云服务器和Namesilo域名搭建个人网站
    本文详细介绍了如何通过Vultr云服务器和Namesilo域名搭建一个功能齐全的个人网站,包括购买、配置服务器以及绑定域名的具体步骤。文章还提供了详细的命令行操作指南,帮助读者顺利完成建站过程。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 在安装并配置了Elasticsearch后,我在尝试通过GET /_nodes请求获取节点信息时遇到了问题,收到了错误消息。为了确保请求的正确性和安全性,我需要进一步排查配置和网络设置,以确保Elasticsearch集群能够正常响应。此外,还需要检查安全设置,如防火墙规则和认证机制,以防止未经授权的访问。 ... [详细]
author-avatar
丁仪亓
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有