当前位置: 开发笔记 > 编程语言 > 正文

【ElasticSearch01】ElasticSearch入门

作者：手机用户2702935165 | 来源：互联网 | 2023-06-15 18:48

目录1.数据类型2.Elasticsearch是什么3.全文搜索引擎4.Elasticsearch安装5.Restful和JSON6.Postman客户端工具7.倒排索引8.Elasticsearch

- 8.1 索引操作
- - 8.1.1 创建索引
  - 8.1.2查询索引
  - - 1.查询指定索引
    - 2.查询所有索引
  - 8.1.3删除索引
- 8.2 文档操作
- - 8.2.1 创建文档
  - 8.2.2 创建文档时自定义id
  - 8.2.3 查询文档
  - - 1.主键查询
    - 2.查询一个不存在的id
    - 3.全查询
  - 8.2.4 修改文档
  - 1.全量修改
  - 2.局部修改
  - 8.2.5 删除文档
  - 8.2.6 复杂查询操作
  - - 1.条件查询
    - 2.全量查询（请求体类型）
    - 3.分页查询
    - 4.多条件查询
    - 1.should是或的关系
    - 2.想要查询价格大于3000的
    - 3.全文检索
    - 4.完全匹配
    - 5.高亮查询
    - 6.聚合查询
    - 7.映射关系

1.数据类型

结构化数据
二维表等，保存到关系型数据库中例如mysql

非结构化数据
图像、视频、工作日志等，保存到Nosql数据库中，比如redis、mongodb中

半结构化数据
html、xml等保存到Nosql数据库中，比如redis、mongodb中

2.Elasticsearch是什么

The Elastic Stack, 包括 Elasticsearch、 Kibana、 Beats 和 Logstash（也称为 ELK Stack）。能够安全可靠地获取任何来源、任何格式的数据，然后实时地对数据进行搜索、分析和可视化。Elaticsearch，简称为 ES， ES 是一个开源的高扩展的分布式全文搜索引擎，是整个 ElasticStack 技术栈的核心。它可以近乎实时的存储、检索数据；本身扩展性很好，可以扩展到上百台服务器，处理 PB 级别的数据。

3.全文搜索引擎

Google，百度类的网站搜索，它们都是根据网页中的关键字生成索引，我们在搜索的时候输入关键字，它们会将该关键字即索引匹配到的所有网页返回；还有常见的项目中应用日志的搜索等等。对于这些非结构化的数据文本，关系型数据库搜索不是能很好的支持。

一般传统数据库，全文检索都实现的很鸡肋，因为一般也没人用数据库存文本字段。进行全文检索需要扫描整个表，如果数据量大的话即使对 SQL 的语法优化，也收效甚微。建立了索引，但是维护起来也很麻烦，对于 insert 和 update 操作都会重新构建索引。

基于以上原因可以分析得出，在一些生产环境中，使用常规的搜索方式，性能是非常差的：

搜索的数据对象是大量的非结构化的文本数据。

文件记录量达到数十万或数百万个甚至更多。

支持大量基于交互式文本的查询。

需求非常灵活的全文搜索查询。

对高度相关的搜索结果的有特殊需求，但是没有可用的关系数据库可以满足。

对不同记录类型、非文本数据操作或安全事务处理的需求相对较少的情况。为了解决结构化数据搜索和非结构化数据搜索性能问题，我们就需要专业，健壮，强大的全文搜索引擎。

这里说到的全文搜索引擎指的是目前广泛应用的主流搜索引擎。它的工作原理是计算机索引程序通过扫描文章中的每一个词，对每一个词建立一个索引，指明该词在文章中出现的次数和位置，当用户查询时，检索程序就根据事先建立的索引进行查找，并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。

4.Elasticsearch安装

Elasticsearch官网
Elasticsearch官方文档
Elasticsearch目录结构

目录	含义
bin	可执行脚本目录
config	配置目录
jdk	内置 JDK 目录
lib	类库
logs	日志目录
modules	模块目录
plugins	插件目录

进入bin文件点击elasticsearch.bat启动elasticsearch
在这里插入图片描述

注意： 9300 端口为 Elasticsearch 集群间组件的通信端口， 9200 端口为浏览器访问的 http协议 RESTful 端口。

打开浏览器，输入地址： http://localhost:9200，测试返回结果，返回结果如下：
在这里插入图片描述

5.Restful和JSON

REST 指的是一组架构约束条件和原则。满足这些约束条件和原则的应用程序或设计就是 RESTful。 Web 应用程序最重要的 REST 原则是，客户端和服务器之间的交互在请求之间是无状态的。从客户端到服务器的每个请求都必须包含理解请求所必需的信息。如果服务器在请求之间的任何时间点重启，客户端不会得到通知。此外，无状态请求可以由任何可用服务器回答，这十分适合云计算之类的环境。客户端可以缓存数据以改进性能。

在服务器端，应用程序状态和功能可以分为各种资源。资源是一个有趣的概念实体，它向客户端公开。资源的例子有：应用程序对象、数据库记录、算法等等。每个资源都使用 URI(Universal Resource Identifier) 得到一个唯一的地址。所有资源都共享统一的接口，以便在客户端和服务器之间传输状态。使用的是标准的 HTTP 方法，比如 GET、 PUT、 POST 和DELETE。

在 REST 样式的 Web 服务中，每个资源都有一个地址。资源本身都是方法调用的目
标，方法列表对所有资源都是一样的。这些方法都是标准方法，包括 HTTP GET、 POST、PUT、 DELETE，还可能包括 HEAD 和 OPTIONS。简单的理解就是，如果想要访问互联网上的资源，就必须向资源所在的服务器发出请求，请求体中必须包含资源的网络路径，以及对资源进行的操作(增删改查)。

REST 样式的 Web 服务若有返回结果，大多数以JSON字符串形式返回。

JSON格式

var obj = {"name":"zhangsan","age":30,"info":{"email":"xxxxx"}}//对象 var objs=[obj,obj]//集合

JSON字符串：网络中传递的字符串的格式符合JSON格式

6.Postman客户端工具

Postman下载官网
如果直接通过浏览器向 Elasticsearch 服务器发请求，那么需要在发送的请求中包含
HTTP 标准的方法，而 HTTP 的大部分特性且仅支持 GET 和 POST 方法。所以为了能方便地进行客户端的访问，可以使用 Postman 软件。

Postman 是一款强大的网页调试工具，提供功能强大的 Web API 和 HTTP 请求调试。软件功能强大，界面简洁明晰、操作方便快捷，设计得很人性化。 Postman 中文版能够发送任何类型的 HTTP 请求 (GET, HEAD, POST, PUT…)，不仅能够表单提交，且可以附带任意类型请求体。

7.倒排索引

Elasticsearch 是面向文档型数据库，一条数据在这里就是一个文档。为了方便大家理解，我们将 Elasticsearch 里存储文档数据和关系型数据库 MySQL 存储数据的概念进行一个类比
在这里插入图片描述
ES 里的 Index 可以看做一个库，而 Types 相当于表， Documents 则相当于表的行。这里 Types 的概念已经被逐渐弱化， Elasticsearch 6.X 中，一个 index 下已经只能包含一个type， Elasticsearch 7.X 中, Type 的概念已经被删除了。

正排（正向）索引

id	content
1001	my name is zhangsan
1002	my name is lisi

如果想要查询文章的内容中包含哪些热门词汇，就会比较麻烦，需要使用模糊查询，模糊查询的效率会差很多，每条数据都要遍历一下会导致性能差并且查询内容的大小写、时态等等都会影响查询的准确率。例如你查询Zhang san那1001的内容是匹配还是不匹配？

倒排索引

keyword	id
name	1001,1002
zhang	1001

通过关键字来查询主键id，然后再来关联文章内容，以前是通过主键id关联文章内容再去找关键字

8.Elasticsearch基本操作

8.1 索引操作

8.1.1 创建索引

对比关系型数据库，创建索引就等同于创建数据库。

在 Postman 中，向 ES 服务器发送PUT请求命令

PUT 请求命令：： http://localhost:9200/shopping

PUT请求相当于创建的意思，这里表示创建一个shopping的索引

在这里插入图片描述

问题： 如果这个时候再去发送请求会怎么样？
答案： PUT具有幂等性，只要发出了同样的请求，结果是一样的，意味着你再去发送一个请求就会有问题，因为此时已经有了shopping这个索引，不需要再添加了。

在这里插入图片描述

8.1.2查询索引

1.查询指定索引

Get 请求命令：： http://localhost:9200/shopping

在这里插入图片描述

2.查询所有索引

GET请求命令：： http://localhost:9200/_cat/indices?v

在这里插入图片描述

8.1.3删除索引

DELTE请求命令：： http://localhost:9200/shopping

在这里插入图片描述

8.2 文档操作

8.2.1 创建文档

假设索引已经创建好了，接下来我们来创建文档，并添加数据。这里的文档可以类比为关系型数据库中的表数据，添加的数据格式为 JSON 格式

POST请求命令：： http://localhost:9200/shopping/_doc

在这里插入图片描述
此时报错，提示请求体是一定要有的，所以要在body中加入内容

{ "title":"小米手机", "category":"小米", "images":"http://www.gulixueyuan.com/xm.jpg", "price":3999.00 }

在这里插入图片描述

"_id": "G5SouIUB5Q51kdfNH1A6"为数据的唯一性标识类似于主键，由es软件随机生成的，同样的请求返回的结果是不同的，所以POST不具有幂等性，但是PUT必须是幂等性的，所以用PUT请求会报错。

8.2.2 创建文档时自定义id

POST请求命令：： http://localhost:9200/shopping/_doc/自己定义的id

在这里插入图片描述

此时指定了id那就说明这个操作是幂等性的，此时PUT也是可以的。

在这里插入图片描述

8.2.3 查询文档

1.主键查询

Get 请求命令：： http://localhost:9200/shopping/_doc/1001

在这里插入图片描述

2.查询一个不存在的id

在这里插入图片描述

3.全查询

Get 请求命令：： http://localhost:9200/shopping/_search

在这里插入图片描述

8.2.4 修改文档

1.全量修改

PUT 请求命令：： http://localhost:9200/shopping/_doc/1001

在这里插入图片描述

2.局部修改

因为更新局部的数据，说明每次更新的结果不会是相同的，那就不是幂等性的，所以不能采用PUT方式，只能采用POST方式

POST请求命令：： http://localhost:9200/shopping/_update/1001

{ "doc":{ "title":"苹果手机" } }

在这里插入图片描述
查询得到的结果

在这里插入图片描述

8.2.5 删除文档

DELETE请求命令：： http://localhost:9200/shopping/_doc/1001

在这里插入图片描述

8.2.6 复杂查询操作

1.条件查询

Get 请求命令：： http://localhost:9200/shopping/_search?q=category:小米

在这里插入图片描述
请求路径中添加额外参数比较麻烦，而且中文容易出现乱码，一般会将请求路径调整为请求体传递参数

{ "query":{ "match":{ "category":"小米" } } }

在这里插入图片描述

2.全量查询（请求体类型）

在这里插入图片描述

3.分页查询

from:表述当前页数据查询的起始位置，如果是第一条的话应该是0
起始位置的计算公式:(页码-1)*每页数据条数
想查询第二页，页码就为2
size:表述每页查询的数据条数

想要的数据指定查询

对结果排序
在这里插入图片描述

4.多条件查询

{ "query": { //bool表示条件 "bool": { //"must"表示多个条件要同时成立 "must":[ { "match":{ "category": "小米" } }, { "match":{ "price": 3999.00 } } ] } } }

在这里插入图片描述

1.should是或的关系

{ "query": { "bool": { "should":[ { "match":{ "category": "小米" } }, { "match":{ "category": "苹果" } } ] } } }

在这里插入图片描述

2.想要查询价格大于3000的

{ "query": { "bool": { "should": [ { "match": { "category": "小米" } }, { "match": { "category": "苹果" } } ], "filter": { "range": { "price": { "gt": 3000 } } } } } }

在这里插入图片描述

3.全文检索

为什么输入一个小也能查询到？
在这里插入图片描述

当保存文档数据时候，es会将数据文字进行分词拆解操作，并将拆解后的数据保存到倒排索引当中，这样即使使用文字的一部分也能查询到数据。
es会将查询内容也进行分词操作，在倒排索引中进行匹配，例如拿小苹查询，苹果和小米都会查询到

在这里插入图片描述

4.完全匹配

{ "query":{ "match_phrase":{ "title":"小苹" } } }

此时去查询数据时完全匹配规则，数据会查不到因为没有title叫小苹
在这里插入图片描述

5.高亮查询

{ "query":{ "match_phrase":{ "category":"小米" } }, "highlight":{ "fields":{ "category":{} } } }

在这里插入图片描述

6.聚合查询

{ //聚合操作 "aggs":{ "price_group":{//名称，随意取 "terms":{//分组操作 "field":"price"//分组字段 } } } }

在这里插入图片描述
此时存在原始数据

加上&＃8221;size&＃8221;:0，原始数据就没有了，只有统计数据

{ //聚合操作 "aggs":{ "price_group":{//名称，随意取 "terms":{//分组操作 "field":"price"//分组字段 } } }, "size":0 }

也可以求平均值
在这里插入图片描述

7.映射关系

有的查询可以分词查询，有的查询不可以分词查询，那怎么控制呢？

先创建一个user索引
在这里插入图片描述
创建结构信息

{ "properties":{ "name":{ "type":"text",//text类型可以分词 "index":true//name字段可以被索引查询 }, "sex":{ "type":"keyword",//keyword不可以分词 "index":true//sex字段可以被索引查询 }, "tel":{ "type":"keyword",//keyword不可以分词 "index":false//tel字段可以被索引查询 } } }

增加数据
在这里插入图片描述

查询姓名
在这里插入图片描述
可以查到说明刚才查询的name是具有分词效果的

查询性别
我这里只有一个男所以没法演示，案例中性别是男的，查询男，查不到所以说明keyword是没法模糊匹配的

查询电话
在这里插入图片描述
说明电话是没有被索引的所以不支持查询

推荐阅读

jar
Ceph API微服务实现RBD块设备的高效创建与安全删除

本文旨在实现Ceph块存储中RBD块设备的高效创建与安全删除功能。开发环境为CentOS 7，使用 IntelliJ IDEA 进行开发。首先介绍了 librbd 的基本概念及其在 Ceph 中的作用，随后详细描述了项目 Gradle 配置的优化过程，确保了开发环境的稳定性和兼容性。通过这一系列步骤，我们成功实现了 RBD 块设备的快速创建与安全删除，提升了系统的整体性能和可靠性。 ... [详细]

蜡笔小新 2024-10-31 15:11:07
join
NoSQL 数据查询与检索技术解析

NoSQL数据库，即非关系型数据库，有时也被称作Not Only SQL，是一种区别于传统关系型数据库的管理系统。这类数据库设计用于处理大规模、高并发的数据存储与查询需求，特别适用于需要快速读写大量非结构化或半结构化数据的应用场景。NoSQL数据库通过牺牲部分一致性来换取更高的可扩展性和性能，支持分布式部署，能够有效应对互联网时代的海量数据挑战。 ... [详细]

蜡笔小新 2024-10-28 18:13:15
join
秒建一个后台管理系统？用这5个开源免费的Java项目就够了

秒建一个后台管理系统？用这5个开源免费的Java项目就够了 ... [详细]

蜡笔小新 2024-11-12 03:21:33
install
服务器部署中的安全策略实践与优化

服务器部署中的安全策略实践与优化 ... [详细]

蜡笔小新 2024-11-10 13:04:30
get
Bootstrap 学习指南：全面掌握前端框架的核心知识点与实战技巧

### 优化后的摘要本学习指南旨在帮助读者全面掌握 Bootstrap 前端框架的核心知识点与实战技巧。内容涵盖基础入门、核心功能和高级应用。第一章通过一个简单的“Hello World”示例，介绍 Bootstrap 的基本用法和快速上手方法。第二章深入探讨 Bootstrap 与 JSP 集成的细节，揭示两者结合的优势和应用场景。第三章则进一步讲解 Bootstrap 的高级特性，如响应式设计和组件定制，为开发者提供全方位的技术支持。 ... [详细]

蜡笔小新 2024-11-09 16:58:21
get
深入解析NoSQL数据库：键值对、文档、列式存储与图数据库的应用与特点

本文深入探讨了NoSQL数据库的四大主要类型：键值对存储、文档存储、列式存储和图数据库。NoSQL（Not Only SQL）是指一系列非关系型数据库系统，它们不依赖于固定模式的数据存储方式，能够灵活处理大规模、高并发的数据需求。键值对存储适用于简单的数据结构；文档存储支持复杂的数据对象；列式存储优化了大数据量的读写性能；而图数据库则擅长处理复杂的关系网络。每种类型的NoSQL数据库都有其独特的优势和应用场景，本文将详细分析它们的特点及应用实例。 ... [详细]

蜡笔小新 2024-11-09 14:47:28
get
Axublog 1.1.0 版本 c_login.php 文件中发现 SQL 注入安全漏洞

在 Axublog 1.1.0 版本的 `c_login.php` 文件中发现了一个严重的 SQL 注入漏洞。该漏洞允许攻击者通过操纵登录请求中的参数，注入恶意 SQL 代码，从而可能获取敏感信息或对数据库进行未授权操作。建议用户尽快更新到最新版本并采取相应的安全措施以防止潜在的风险。 ... [详细]

蜡笔小新 2024-11-09 13:37:09
get
Web开发框架概览：Java与JavaScript技术及框架综述

Web开发涉及服务器端和客户端的协同工作。在服务器端，Java是一种优秀的编程语言，适用于构建各种功能模块，如通过Servlet实现特定服务。客户端则主要依赖HTML进行内容展示，同时借助JavaScript增强交互性和动态效果。此外，现代Web开发还广泛使用各种框架和库，如Spring Boot、React和Vue.js，以提高开发效率和应用性能。 ... [详细]

蜡笔小新 2024-11-09 11:59:38
client
小王详解：内部网络中最易理解的NAT原理剖析，挑战你的认知极限

小王详解：内部网络中最易理解的NAT原理剖析，挑战你的认知极限 ... [详细]

蜡笔小新 2024-11-07 15:11:42
byte
Python 数据库操作指南：MySQL 与 Redis 实战技巧

本文详细介绍了使用 Python 进行 MySQL 和 Redis 数据库操作的实战技巧。首先，针对 MySQL 数据库，通过 `pymysql` 模块展示了如何连接和操作数据库，包括建立连接、执行查询和更新等常见操作。接着，文章深入探讨了 Redis 的基本命令和高级功能，如键值存储、列表操作和事务处理。此外，还提供了多个实际案例，帮助读者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-11-07 12:55:01
get
开发心得：利用 Redis 构建分布式系统的轻量级协调机制

开发心得：利用 Redis 构建分布式系统的轻量级协调机制 ... [详细]

蜡笔小新 2024-10-29 07:37:33
controller
.NET Core 2.* 开发者指南：全面学习与实践手册

本书《.NET Core 2.* 开发者指南》是面向开发者的全面学习与实践手册，涵盖了从基础到高级的各个层面。书中详细解析了 .NET Core 的核心概念，包括如何创建 .NET Core 网站，并通过视频教程直观展示操作过程。此外，还深入探讨了 Startup 类的作用、项目目录结构的组织方式以及如何在应用中使用静态文件等内容。对于希望深入了解 .NET Core 架构和开发技巧的开发者来说，本书提供了丰富的实践案例和详尽的技术指导。 ... [详细]

蜡笔小新 2024-10-27 13:05:35
object
逐步掌握游戏账户服务数据库与Erlang服务器开发技巧

本文将深入探讨MySQL与MongoDB在游戏账户服务中的应用特点及优劣。通过对比这两种数据库的性能、扩展性和数据一致性，结合实际案例，帮助开发者更好地选择适合游戏账户服务的数据库方案。同时，文章还将介绍如何利用Erlang语言进行高效的游戏服务器开发，提升系统的稳定性和并发处理能力。 ... [详细]

蜡笔小新 2024-10-25 15:45:30
get
掌握 MongoDB 基础操作与实用技巧

掌握 MongoDB 基础操作与实用技巧 ... [详细]

蜡笔小新 2024-10-22 14:12:23
get
帝国CMS中的信息归档功能详解及其重要性

本文详细解析了帝国CMS中的信息归档功能，并探讨了其在内容管理中的重要性。通过归档功能，用户可以有效地管理和组织大量内容，提高网站的运行效率和用户体验。此外，文章还介绍了如何利用该功能进行数据备份和恢复，确保网站数据的安全性和完整性。 ... [详细]

蜡笔小新 2024-11-09 20:42:14

手机用户2702935165

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章