热门标签 | HotTags
当前位置:  开发笔记 > 前端 > 正文

ElasticSearch(全文检索--倒排索引)(es倒排索引数据结构)

本文主要分享【es倒排索引数据结构】,技术文章【ElasticSearch(全文检索--倒排索引)】为【perfect-ws】投稿,如果你遇到ElasticSerach相关问题,本文相关知识或能到你。

本文主要分享【es倒排索引数据结构】,技术文章【ElasticSearch(全文检索--倒排索引)】为【perfect-ws】投稿,如果你遇到ElasticSerach相关问题,本文相关知识或能到你。

es倒排索引数据结构

ElasticSearch(全文检索–倒排索引)

参考:https://blog.csdn.net/young_1004/article/details/83049412

整体结构 集群

img

节点

img

索引–index–重点

由一个或者多个节点,多个绿色小方块组合在一起形成的ElasticSearch的索引

img

分片–shard

img

一个分片就是一个Lucene index

img

每个Lucene里面有很多Segment–Segment为最小管理单元

 img

倒排索引

img

ElasticSearch是以文档为最小单位的搜索引擎的索引其实就是实现单词–文档矩阵的具体数据结构,可以有多种不同的方式来实现上述概念模型,比如“倒排索引”,“签名文件”等方式,但是倒排索引是最佳实现方式

倒排索引是实现“单词-文档矩阵”的一种具体存储形式,通过倒排索引,可以根据单词快速获取包含这个单词的文档列表。倒排索引主要由两个部分组成:“单词词典”和“倒排文件”。

倒排索引实例

将第一张文档的数据,转换成第二个图片的索引过程

ElasticSearch(全文检索--倒排索引)(es倒排索引数据结构)


ElasticSearch(全文检索--倒排索引)(es倒排索引数据结构)

名词:

文档:一般搜索引擎的处理对象是互联网网页,文档这个概念要更宽泛代表以文档形式存在的存储对象,如word,pdf,htmlmxml等不同格式的文件,再比如一封邮件,一条微博也可以称为文档

的存储对象,如word,pdf,htmlmxml等不同格式的文件,再比如一封邮件,一条微博也可以称为文档

本文《ElasticSearch(全文检索--倒排索引)》版权归perfect-ws所有,引用ElasticSearch(全文检索--倒排索引)需遵循CC 4.0 BY-SA版权协议。


推荐阅读
  • Solr的安装与部署指南
    Solr作为一款独立的企业级搜索应用服务器,支持Web-service风格的API接口,允许用户通过HTTP请求提交XML文件以创建索引或执行搜索操作。本文将详细介绍Solr的安装步骤及配置方法。 ... [详细]
  • 本文详细探讨了成为一名合格的初级Java工程师所需掌握的知识体系,以及从初级到中级乃至高级工程师的成长路径和职业发展前景。 ... [详细]
  • Spring Boot与Graylog集成实现微服务日志聚合与分析
    本文介绍了如何在Graylog中配置输入源,并详细说明了Spring Boot项目中集成Graylog的日志聚合和分析方法,包括logback.xml的多环境配置。 ... [详细]
  • (1)XML预处理读取test.xml并修改url节点下的localhost信息,以保证预览和下载用户所需正确资源。过程如下: ... [详细]
  • 本文详细介绍了如何解决Uploadify插件在Internet Explorer(IE)9和10版本中遇到的点击失效及JQuery运行时错误问题。通过修改相关JavaScript代码,确保上传功能在不同浏览器环境中的一致性和稳定性。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 360SRC安全应急响应:从漏洞提交到修复的全过程
    本文详细介绍了360SRC平台处理一起关键安全事件的过程,涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例,展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]
  • ElasticSearch 集群监控与优化
    本文详细介绍了如何有效地监控 ElasticSearch 集群,涵盖了关键性能指标、集群健康状况、统计信息以及内存和垃圾回收的监控方法。 ... [详细]
  • 构建Filebeat-Kafka-Logstash-ElasticSearch-Kibana日志收集体系
    本文介绍了如何使用Filebeat、Kafka、Logstash、ElasticSearch和Kibana构建一个高效、可扩展的日志收集与分析系统。各组件分别承担不同的职责,确保日志数据能够被有效收集、处理、存储及可视化。 ... [详细]
  • 本文介绍了Elasticsearch的基本概念,包括集群、节点、分片和副本的定义,并详细解释了如何执行文档和索引的CRUD操作。同时,文章还探讨了Elasticsearch与传统关系型数据库MySQL之间的对应关系,以及倒排索引的工作原理。 ... [详细]
  • 本文介绍了Elasticsearch (ES),这是一个基于Java开发的开源全文搜索引擎。ES通过JSON接口提供服务,支持分布式集群管理和索引功能,特别适合大规模数据的快速搜索与分析。 ... [详细]
  • 如何将955万数据表的17秒SQL查询优化至300毫秒
    本文详细介绍了通过优化SQL查询策略,成功将一张包含955万条记录的财务流水表的查询时间从17秒缩短至300毫秒的方法。文章不仅提供了具体的SQL优化技巧,还深入探讨了背后的数据库原理。 ... [详细]
  • 在安装并配置了Elasticsearch后,我在尝试通过GET /_nodes请求获取节点信息时遇到了问题,收到了错误消息。为了确保请求的正确性和安全性,我需要进一步排查配置和网络设置,以确保Elasticsearch集群能够正常响应。此外,还需要检查安全设置,如防火墙规则和认证机制,以防止未经授权的访问。 ... [详细]
author-avatar
悉尼新鲜事儿
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有