ElasticSearch7.x的基本操作学习（一）:概念了解

作者：飞教书的粉红色 | 来源：互联网 | 2023-07-16 13:48

什么是ElasticSearchElasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基于RESTfulweb接

什么是ElasticSearch

Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎&＃xff0c;基于RESTful web接口。Elasticsearch是用Java语言开发的&＃xff0c;并作为Apache许可条款下的开放源码发布&＃xff0c;是一种流行的企业级搜索引擎。Elasticsearch用于云计算中&＃xff0c;能够达到实时搜索&＃xff0c;稳定&＃xff0c;可靠&＃xff0c;快速&＃xff0c;安装使用方便。官方客户端在Java、.NET&＃xff08;C#&＃xff09;、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines的排名显示&＃xff0c;Elasticsearch是最受欢迎的企业搜索引擎&＃xff0c;其次是Apache Solr&＃xff0c;也是基于Lucene。

简单来说&＃xff1a;就是用于做全文搜索&＃xff0c;结构化搜索&＃xff0c;分析使用;

1.ElasticSearch的安装

注意:对于java的JDK要求&＃xff0c;最低也得1.8

点击进入es官网地址下载

IK分词器下载

Kibana华为云镜像下载

1.1ES的启动

启动成功&＃xff0c;出现127.0.0.1/9200
访问一下呗~

2.安装ES的可视化界面&＃xff1a;es-head

点击获取es-head的下载地址

注意&＃xff1a;在windows下&＃xff0c;安装head插件需要NodeJS的环境&＃xff1b;

在head插件中&＃xff0c;输入cmd打开终端窗口&＃xff0c;输入npm run start 启动前端项目

在这里插入图片描述

打开页面&＃xff0c;发现已经启动好了head插件

在这里插入图片描述

注意&＃xff1a;第一次启动head插件的时候可能会出现跨域错误&＃xff0c;改如何解决&＃xff1a;
打开es->找到config文件夹->打开elasticsearch.yml->配置下图内容即可&＃xff1a;
在这里插入图片描述

2.1利用head插件创建一个索引

对于初学:我自己的建议是把es看做一张数据库表就可以了&＃xff0c;然后可以在数据库中创建表等一些操作.

在这里插入图片描述

3.kibana的安装

3.1kibana的介绍

Kibana是一个开源的分析与可视化平台&＃xff0c;设计出来用于和Elasticsearch一起使用的。你可以用kibana搜索、查看存放在Elasticsearch中的数据。Kibana与Elasticsearch的交互方式是各种不同的图表、表格、地图等&＃xff0c;直观的展示数据&＃xff0c;从而达到高级的数据分析与可视化的目的。
Elasticsearch、Logstash和Kibana这三个技术就是我们常说的ELK技术栈&＃xff0c;可以说这三个技术的组合是大数据领域中一个很巧妙的设计。一种很典型的MVC思想&＃xff0c;模型持久层&＃xff0c;视图层和控制层。Logstash担任控制层的角色&＃xff0c;负责搜集和过滤数据。Elasticsearch担任数据持久层的角色&＃xff0c;负责储存数据。而我们这章的主题Kibana担任视图层角色&＃xff0c;拥有各种维度的查询和分析&＃xff0c;并使用图形化的界面展示存放在Elasticsearch中的数据。

作者&＃xff1a;叩丁狼教育
链接&＃xff1a;https://www.jianshu.com/p/8001ac47c378
来源&＃xff1a;简书
著作权归作者所有。商业转载请联系作者获得授权&＃xff0c;非商业转载请注明出处。

简单来说:就是用于es的可视化平台&＃xff0c;用来搜索&＃xff0c;查看交互存储在es中的索引数据.

下载地址:kibana对应的华为云的镜像地址

直接点击启动即可:
在这里插入图片描述

4.ES核心概念

记住一个观点:ES是面向文档

关系型数据和ES的比较:

关系型数据库	ElaticSearch
数据库	索引&＃xff08;index&＃xff09;
表	类型
行	文档
字段	属性名称

elasticsearch(集群)中可以包含多个索引(数据库)&＃xff0c;每个索引中可以包含多个类型(表)&＃xff0c;每个类型下又包含多个文档(行)&＃xff0c;每个文档中又包含多个字段(列)。

物理设计&＃xff1a;
es把后台的索引分片成多个&＃xff0c;每片分片可以在集群的不同的服务器迁移&＃xff1b;
就算es只有一台&＃xff0c;那么对于它自己而言&＃xff0c;它一个就是集群;

文档–>(一条数据)

之前说elasticsearch是面向文档的&＃xff0c;那么就意味着索引和搜索数据的最小单位是文档&＃xff0c;elasticsearch中&＃xff0c;文档有几个重要属性:

自我包含&＃xff0c;一篇文档同时包含字段和对应的值&＃xff0c;也就是同时包含key:value !
可以是层次型的&＃xff0c;一个文档中包含自文档&＃xff0c;复杂的逻辑实体就是这么来的! {就是一个json对象 ! fastjson进行自动转换 !}
灵活的结构&＃xff0c;文档不依赖预先定义的模式&＃xff0c;我们知道关系型数据库中&＃xff0c;要提前定义字段才能使用&＃xff0c;在elasticsearch中&＃xff0c;对于字段是非常灵活的&＃xff0c;有时候,我们可以忽略该字段&＃xff0c;或者动态的添加一个新的字段。

类型—>(一张表)

类型是文档的逻辑容器&＃xff0c;就像关系型数据库一样&＃xff0c;表格是行的容器。类型中对于字段的定义称为映射&＃xff0c;比如name映射为字符串类型。我们说文档是无模式的&＃xff0c;它们不需要拥有映射中所定义的所有字段&＃xff0c;比如新增一个字段&＃xff0c;那么elasticsearch是怎么做的呢?

elasticsearch会自动的将新字段加入映射&＃xff0c;但是这个字段的不确定它是什么类型&＃xff0c;elasticsearch就开始猜&＃xff0c;如果这个值是18&＃xff0c;那么elasticsearch会认为它是整形。但是elasticsearch也可能猜不对&＃xff0c;所以最安全的方式就是提前定义好所需要的映射&＃xff0c;这点跟关系型数据库殊途同归了&＃xff0c;先定义好字段&＃xff0c;然后再使用&＃xff0c;别整什么幺蛾子。

索引–>(相当于一个数据库,里面可以有很多表)

索引是映射类型的容器&＃xff0c; elasticsearch中的索引是一个非常大的文档集合。索引存储了映射类型的字段和其他设置。然后它们被存储到了各个分片上了。我们来研究下分片是如何工作的。

5.ES的倒排索引

简单说就是按&＃xff08;文章关键字&＃xff0c;对应的文档<0个或多个>&＃xff09;形式建立索引&＃xff0c;根据关键字就可直接查询对应的文档&＃xff08;含关键字的&＃xff09;&＃xff0c;无需查询每一个文档&＃xff0c;如下图

在这里插入图片描述比如说我们去查询有python的数据&＃xff0c;我们可以不再根据id一个个来查询标签&＃xff0c;而是直接找到标签所对应的文章id即可&＃xff0c;完全过滤掉无关的数据&＃xff0c;提高查询效率。

6.IK分词器(elasticsearch插件)

可以理解为&＃xff1a;中文分词器

6.1 IK分词器有什么用呢?

分词&＃xff1a;即把一段中文或者别的划分成一个个的关键字&＃xff0c;我们在搜索时候会把自己的信息进行分词&＃xff0c;会把数据库中或者索引库中的数据进行分词&＃xff0c;然后进行一一个匹配操作&＃xff0c;默认的中文分词是将每个字看成一个词&＃xff08;不使用用IK分词器的情况下&＃xff09;&＃xff0c;比如“我爱中国”会被分为”我”&＃xff0c;”爱”&＃xff0c;”狂”&＃xff0c;”神” &＃xff0c;这显然是不符合要求的&＃xff0c;所以我们需要安装中文分词器ik来解决这个问题。

6.2 下载地址:

https://github.com/medcl/elasticsearch-analysis-ik/releases

6.3如何使用

1.下载完毕后&＃xff0c;放入es的plugins目录下
在这里插入图片描述 2.然后&＃xff0c;重启我们的es;
3.测试:
1.ik_smart&＃xff1a;最少切分&＃xff08;意思是:尽量组成词语&＃xff0c;少做切分&＃xff09;

2.ik_max_word&＃xff1a;最细粒度划分&＃xff08;穷尽词库的可能&＃xff0c;尽量组成词语&＃xff0c;多做切分&＃xff0c;提高查询的可能性&＃xff09;
在这里插入图片描述 3.从上面看&＃xff0c;感觉分词都比较正常&＃xff0c;但是大多数&＃xff0c;分词都满足不了我们的想法&＃xff0c;如下例

在这里插入图片描述那么&＃xff0c;我们需要手动将该词添加到分词器的词典当中

在这里插入图片描述

推荐阅读

java
音视频服务Java Web服务器部署详解与验证流程

本文详细介绍了如何在Java Web服务器上部署音视频服务，并提供了完整的验证流程。以AnyChat为例，这是一款跨平台的音视频解决方案，广泛应用于需要实时音视频交互的项目中。通过具体的部署步骤和测试方法，确保了音视频服务的稳定性和可靠性。 ... [详细]

蜡笔小新 2024-11-06 14:45:13
web
PHP 各版本对比：标准版与最新顶级版的详细分析

PHP 各版本对比：标准版与最新顶级版的详细分析 ... [详细]

蜡笔小新 2024-11-11 13:23:25
byte
第二章：Kafka基础入门与核心概念解析

本章节主要介绍了Kafka的基本概念及其核心特性。Kafka是一种分布式消息发布和订阅系统，以其卓越的性能和高吞吐量而著称。最初，Kafka被设计用于LinkedIn的活动流和运营数据处理，旨在高效地管理和传输大规模的数据流。这些数据主要包括用户活动记录、系统日志和其他实时信息。通过深入解析Kafka的设计原理和应用场景，读者将能够更好地理解其在现代大数据架构中的重要地位。 ... [详细]

蜡笔小新 2024-11-06 11:10:03
java
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
ip
如何在Linux服务器上配置MySQL和Tomcat的开机自动启动

在Linux服务器上部署Web项目时，通常需要确保MySQL和Tomcat服务能够随系统启动而自动运行。本文将详细介绍如何在Linux环境中配置MySQL和Tomcat的开机自启动，以确保服务的稳定性和可靠性。通过合理的配置，可以有效避免因服务未启动而导致的项目故障。 ... [详细]

蜡笔小新 2024-11-11 19:41:03
ip
在Linux系统中避免安装MySQL的简易指南

在Linux系统中避免安装MySQL的简易指南 ... [详细]

蜡笔小新 2024-11-11 13:22:28
web
CTF竞赛中文件上传技巧与安全绕过方法深入解析

CTF竞赛中文件上传技巧与安全绕过方法深入解析 ... [详细]

蜡笔小新 2024-11-07 15:41:52
java
datetime 索引_【免费毕设】ASP.NET基于Ajax+Lucene构建搜索引擎的设计和实现(源代码+论文)...

点击上方“蓝字”关注我们目录系统设计4.1搜索引擎模型模型包括爬虫、索引生成、查询以及系统配置部分。爬虫包括：网页抓取模块、网页减肥模块、爬虫维持模块。索引生成包括& ... [详细]

蜡笔小新 2024-10-09 12:30:45
java
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
web
ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES

一、认识ElasticSearch是一个基于Lucene的开源搜索引擎，通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索，分析系统&# ... [详细]

蜡笔小新 2023-12-09 10:36:06
java
部署solr建立nutch索引

2019独角兽企业重金招聘Python工程师标准接着上篇nutch1.4的部署应用，我们来部署一下solr，solr是对lucene进行了封装的企 ... [详细]

蜡笔小新 2023-10-16 18:06:09
ip
网站访问全流程解析

本文详细介绍了从用户在浏览器中输入一个域名（如www.yy.com）到页面完全展示的整个过程，包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]

蜡笔小新 2024-11-12 18:13:16
header
解决 Ubuntu 下 Samba 重新安装时配置文件未重新生成的问题

在 Ubuntu 中遇到 Samba 服务器故障时，尝试卸载并重新安装 Samba 发现配置文件未重新生成。本文介绍了解决该问题的方法。 ... [详细]

蜡笔小新 2024-11-12 13:02:23
input
php更新数据库字段的函数是,php更新数据库字段的函数是

php更新数据库字段的函数是,php更新数据库字段的函数是 ... [详细]

蜡笔小新 2024-11-12 11:37:31
java
Ave V8 JavaScript 引擎：持续优化与创新

V8不仅是一款著名的八缸发动机，广泛应用于道奇Charger、宾利Continental GT和BossHoss摩托车中。自2008年以来，作为Chromium项目的一部分，V8 JavaScript引擎在性能优化和技术创新方面取得了显著进展。该引擎通过先进的编译技术和高效的垃圾回收机制，显著提升了JavaScript的执行效率，为现代Web应用提供了强大的支持。持续的优化和创新使得V8在处理复杂计算和大规模数据时表现更加出色，成为众多开发者和企业的首选。 ... [详细]

蜡笔小新 2024-11-09 15:56:40

飞教书的粉红色

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章