Elasticsearch系列(三)ES集群

作者：秋秋传奇哦_729 | 来源：互联网 | 2023-07-08 17:39

本文转载自:ES分布式集群个人觉得本章非常重要，特转载本章；前言本章我们解释一些通用的术语，例如集群(cluster)、节点(node

本文转载自:ES分布式集群

个人觉得本章非常重要&＃xff0c;特转载本章&＃xff1b;

前言

本章我们解释一些通用的术语&＃xff0c;例如集群(cluster)、节点(node)和分片(shard)&＃xff0c;Elasticsearch的扩展机制&＃xff0c;以及它如何处理硬件故障。我们在使用Elasticsearch的时候可以长时间甚至永远都不必担心分片、复制和故障转移——但是它会帮助你理解Elasticsearch内部的工作流程。

Elasticsearch用于构建高可用和可扩展的系统。扩展的方式可以是购买更好的服务器(纵向扩展(vertical scale or scaling up))或者购买更多的服务器&＃xff08;横向扩展(horizontal scale or scaling out)&＃xff09;。

Elasticsearch虽然能从更强大的硬件中获得更好的性能&＃xff0c;但是纵向扩展有它的局限性。真正的扩展应该是横向的&＃xff0c;它通过增加节点来均摊负载和增加可靠性。

对于大多数数据库而言&＃xff0c;横向扩展意味着你的程序将做非常大的改动才能利用这些新添加的设备。对比来说&＃xff0c;Elasticsearch天生就是分布式的&＃xff1a;它知道如何管理节点来提供高扩展和高可用。这意味着你的程序不需要关心这些。

在这章我们将探索如何创建你的集群(cluster)、节点(node)和分片(shards)&＃xff0c;使其按照你的需求进行扩展&＃xff0c;并保证在硬件故障时数据依旧安全。

一、空集群

如果我们启动一个单独的节点&＃xff0c;它还没有数据和索引&＃xff0c;这个集群看起来就像图1
空集群
图1&＃xff1a;只有一个空节点的集群

一个节点(node)就是一个Elasticsearch实例&＃xff0c;而一个集群(cluster)由一个或多个节点组成&＃xff0c;它们具有相同的cluster.name&＃xff0c;它们协同工作&＃xff0c;分享数据和负载。当加入新的节点或者删除一个节点时&＃xff0c;集群就会感知到并平衡数据。

集群中一个节点会被选举为主节点(master),它将临时管理集群级别的一些变更&＃xff0c;例如新建或删除索引、增加或移除节点等。主节点不参与文档级别的变更或搜索&＃xff0c;这意味着在流量增长的时候&＃xff0c;该主节点不会成为集群的瓶颈。任何节点都可以成为主节点。我们例子中的集群只有一个节点&＃xff0c;所以它会充当主节点的角色。

做为用户&＃xff0c;我们能够与集群中的任何节点通信&＃xff0c;包括主节点。每一个节点都知道文档存在于哪个节点上&＃xff0c;它们可以转发请求到相应的节点上。我们访问的节点负责收集各节点返回的数据&＃xff0c;最后一起返回给客户端。这一切都由Elasticsearch处理。

二、集群健康

在Elasticsearch集群中可以监控统计很多信息&＃xff0c;但是只有一个是最重要的&＃xff1a;集群健康(cluster health)。集群健康有三种状态&＃xff1a;green、yellow或red。

GET /_cluster/health

在一个没有索引的空集群中运行如上查询&＃xff0c;将返回这些信息&＃xff1a;

{"cluster_name": "elasticsearch","status": "green", <1>"timed_out": false,"number_of_nodes": 1,"number_of_data_nodes": 1,"active_primary_shards": 0,"active_shards": 0,"relocating_shards": 0,"initializing_shards": 0,"unassigned_shards": 0 }

status字段提供一个综合的指标来表示集群的的服务状况。三种颜色各自的含义&＃xff1a;

颜色	意义
green	所有主要分片和复制分片都可用
yellow	所有主要分片可用&＃xff0c;但不是所有复制分片都可用
red	不是所有的主要分片都可用

在接下来的章节&＃xff0c;我们将说明什么是主要分片(primary shard)和复制分片(replica shard)&＃xff0c;并说明这些颜色&＃xff08;状态&＃xff09;在实际环境中的意义。

为了将数据添加到Elasticsearch&＃xff0c;我们需要索引(index)——一个存储关联数据的地方。实际上&＃xff0c;索引只是一个用来指向一个或多个分片(shards)的“逻辑命名空间(logical namespace)”。

一个分片(shard)是一个最小级别“工作单元(worker unit)”,它只是保存了索引中所有数据的一部分。在接下来的《深入分片》一章&＃xff0c;我们将详细说明分片的工作原理&＃xff0c;但是现在我们只要知道分片就是一个Lucene实例&＃xff0c;并且它本身就是一个完整的搜索引擎。我们的文档存储在分片中&＃xff0c;并且在分片中被索引&＃xff0c;但是我们的应用程序不会直接与它们通信&＃xff0c;取而代之的是&＃xff0c;直接与索引通信。

分片是Elasticsearch在集群中分发数据的关键。把分片想象成数据的容器。文档存储在分片中&＃xff0c;然后分片分配到你集群中的节点上。当你的集群扩容或缩小&＃xff0c;Elasticsearch将会自动在你的节点间迁移分片&＃xff0c;以使集群保持平衡。

分片可以是主分片(primary shard)或者是复制分片(replica shard)。你索引中的每个文档属于一个单独的主分片&＃xff0c;所以主分片的数量决定了索引最多能存储多少数据。

三、添加索引

分片可以是主分片(primary shard)或者是复制分片(replica shard)。你索引中的每个文档属于一个单独的主分片&＃xff0c;所以主分片的数量决定了索引最多能存储多少数据。
理论上主分片能存储的数据大小是没有限制的&＃xff0c;限制取决于你实际的使用情况。分片的最大容量完全取决于你的使用状况&＃xff1a;硬件存储的大小、文档的大小和复杂度、如何索引和查询你的文档&＃xff0c;以及你期望的响应时间。

复制分片只是主分片的一个副本&＃xff0c;它可以防止硬件故障导致的数据丢失&＃xff0c;同时可以提供读请求&＃xff0c;比如搜索或者从别的shard取回文档。
当索引创建完成的时候&＃xff0c;主分片的数量就固定了&＃xff0c;但是复制分片的数量可以随时调整。

让我们在集群中唯一一个空节点上创建一个叫做blogs的索引。默认情况下&＃xff0c;一个索引被分配5个主分片&＃xff0c;但是为了演示的目的&＃xff0c;我们只分配3个主分片和一个复制分片&＃xff08;每个主分片都有一个复制分片&＃xff09;&＃xff1a;

PUT /blogs {"settings" : {"number_of_shards" : 3,"number_of_replicas" : 1} }

附带索引的单一节点集群&＃xff1a;
在这里插入图片描述
我们的集群现在看起来就像上图——三个主分片都被分配到Node 1。如果我们现在检查集群健康(cluster-health)&＃xff0c;我们将见到以下信息&＃xff1a;

{"cluster_name": "elasticsearch","status": "yellow", <1>"timed_out": false,"number_of_nodes": 1,"number_of_data_nodes": 1,"active_primary_shards": 3,"active_shards": 3,"relocating_shards": 0,"initializing_shards": 0,"unassigned_shards": 3 <2> }

集群的健康状态yellow表示所有的主分片(primary shards)启动并且正常运行了——集群已经可以正常处理任何请求——但是复制分片(replica shards)还没有全部可用。事实上所有的三个复制分片现在都是unassigned状态——它们还未被分配给节点。在同一个节点上保存相同的数据副本是没有必要的&＃xff0c;如果这个节点故障了&＃xff0c;那所有的数据副本也会丢失。

现在我们的集群已经功能完备&＃xff0c;但是依旧存在因硬件故障而导致数据丢失的风险。

四、增加故障转移

在单一节点上运行意味着有单点故障的风险——没有数据备份。幸运的是&＃xff0c;要防止单点故障&＃xff0c;我们唯一需要做的就是启动另一个节点。

启动第二个节点

为了测试在增加第二个节点后发生了什么&＃xff0c;你可以使用与第一个节点相同的方式启动第二个节点&＃xff08;《运行Elasticsearch》一章&＃xff09;&＃xff0c;而且命令行在同一个目录——一个节点可以启动多个Elasticsearch实例。
只要第二个节点与第一个节点有相同的cluster.name&＃xff08;请看./config/elasticsearch.yml文件&＃xff09;&＃xff0c;它就能自动发现并加入第一个节点所在的集群。如果没有&＃xff0c;检查日志找出哪里出了问题。这可能是网络广播被禁用&＃xff0c;或者防火墙阻止了节点通信。

如果我们启动了第二个节点&＃xff0c;这个集群看起来就像下图。
双节点集群——所有的主分片和复制分片都已分配:
在这里插入图片描述
第二个节点已经加入集群&＃xff0c;三个复制分片(replica shards)也已经被分配了——分别对应三个主分片&＃xff0c;这意味着在丢失任意一个节点的情况下依旧可以保证数据的完整性。
文档的索引将首先被存储在主分片中&＃xff0c;然后并发复制到对应的复制节点上。这可以确保我们的数据在主节点和复制节点上都可以被检索。
cluster-health现在的状态是green&＃xff0c;这意味着所有的6个分片&＃xff08;三个主分片和三个复制分片&＃xff09;都已可用&＃xff1a;

{"cluster_name": "elasticsearch","status": "green", <1>"timed_out": false,"number_of_nodes": 2,"number_of_data_nodes": 2,"active_primary_shards": 3,"active_shards": 6,"relocating_shards": 0,"initializing_shards": 0,"unassigned_shards": 0 }

集群的状态是green
我们的集群不仅是功能完备的&＃xff0c;而且是高可用的。

五、横向扩展

随着应用需求的增长&＃xff0c;我们该如何扩展&＃xff1f;如果我们启动第三个节点&＃xff0c;我们的集群会重新组织自己&＃xff0c;就像图4&＃xff1a;

图4&＃xff1a;包含3个节点的集群——分片已经被重新分配以平衡负载&＃xff1a;

在这里插入图片描述
Node3包含了分别来自Node 1和Node 2的一个分片&＃xff0c;这样每个节点就有两个分片&＃xff0c;和之前相比少了一个&＃xff0c;这意味着每个节点上的分片将获得更多的硬件资源&＃xff08;CPU、RAM、I/O&＃xff09;。

分片本身就是一个完整的搜索引擎&＃xff0c;它可以使用单一节点的所有资源。我们拥有6个分片&＃xff08;3个主分片和三个复制分片&＃xff09;&＃xff0c;最多可以扩展到6个节点&＃xff0c;每个节点上有一个分片&＃xff0c;每个分片可以100%使用这个节点的资源。

六、继续扩展

如果我们要扩展到6个以上的节点&＃xff0c;要怎么做&＃xff1f;
主分片的数量在创建索引时已经确定。实际上&＃xff0c;这个数量定义了能存储到索引里数据的最大数量&＃xff08;实际的数量取决于你的数据、硬件和应用场景&＃xff09;。然而&＃xff0c;主分片或者复制分片都可以处理读请求——搜索或文档检索&＃xff0c;所以数据的冗余越多&＃xff0c;我们能处理的搜索吞吐量就越大。

复制分片的数量可以在运行中的集群中动态地变更&＃xff0c;这允许我们可以根据需求扩大或者缩小规模。让我们把复制分片的数量从原来的1增加到2&＃xff1a;

PUT /blogs/_settings {"number_of_replicas" : 2 }

图5&＃xff1a;增加number_of_replicas到2&＃xff1a;

在这里插入图片描述
从图中可以看出&＃xff0c;blogs索引现在有9个分片&＃xff1a;3个主分片和6个复制分片。这意味着我们能够扩展到9个节点&＃xff0c;再次变成每个节点一个分片。这样使我们的搜索性能相比原始的三节点集群增加三倍。

当然&＃xff0c;在同样数量的节点上增加更多的复制分片并不能提高性能&＃xff0c;因为这样做的话平均每个分片的所占有的硬件资源就减少了&＃xff08;译者注&＃xff1a;大部分请求都聚集到了分片少的节点&＃xff0c;导致一个节点吞吐量太大&＃xff0c;反而降低性能&＃xff09;&＃xff0c;你需要增加硬件来提高吞吐量。

不过这些额外的复制节点使我们有更多的冗余&＃xff1a;通过以上对节点的设置&＃xff0c;我们能够承受两个节点故障而不丢失数据。

七、应对故障

我们已经说过Elasticsearch可以应对节点失效&＃xff0c;所以让我们继续尝试。如果我们杀掉第一个节点的进程&＃xff08;以下简称杀掉节点&＃xff09;&＃xff0c;我们的集群看起来就像这样&＃xff1a;

图5&＃xff1a;杀掉第一个节点后的集群
在这里插入图片描述
我们杀掉的节点是一个主节点。一个集群必须要有一个主节点才能使其功能正常&＃xff0c;所以集群做的第一件事就是各节点选举了一个新的主节点&＃xff1a;Node 2。

主分片1和2在我们杀掉Node 1时已经丢失&＃xff0c;我们的索引在丢失主分片时不能正常工作。如果此时我们检查集群健康&＃xff0c;我们将看到状态red&＃xff1a;不是所有主分片都可用&＃xff01;

幸运的是丢失的两个主分片的完整拷贝存在于其他节点上&＃xff0c;所以新主节点做的第一件事是把这些在Node 2和Node 3上的复制分片升级为主分片&＃xff0c;这时集群健康回到yellow状态。这个提升是瞬间完成的&＃xff0c;就好像按了一下开关。

为什么集群健康状态是yellow而不是green&＃xff1f;我们有三个主分片&＃xff0c;但是我们指定了每个主分片对应两个复制分片&＃xff0c;当前却只有一个复制分片被分配&＃xff0c;这就是集群状态无法达到green的原因&＃xff0c;不过不用太担心这个&＃xff1a;当我们杀掉Node 2&＃xff0c;我们的程序依然可以在没有丢失数据的情况下继续运行&＃xff0c;因为Node 3还有每个分片的拷贝。

如果我们重启Node 1&＃xff0c;集群将能够重新分配丢失的复制分片&＃xff0c;集群状况与上一节的图5&＃xff1a;增加number_of_replicas到2 类似。如果Node 1依旧有旧分片的拷贝&＃xff0c;它将会尝试再利用它们&＃xff0c;它只会从主分片上复制在故障期间有数据变更的那一部分。

现在你应该对分片如何使Elasticsearch可以水平扩展并保证数据安全有了一个清晰的认识。

本文转载自:ES分布式集群

推荐阅读

容器
ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES

一、认识ElasticSearch是一个基于Lucene的开源搜索引擎，通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索，分析系统&# ... [详细]

蜡笔小新 2023-12-09 10:36:06
go
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
go
SQL日志收缩及截断方法详解

本文详细介绍了SQL日志收缩的方法，包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时，还介绍了截断日志的原理和注意事项，包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法，可以有效减小逻辑日志的大小，提高数据库的性能。 ... [详细]

蜡笔小新 2023-12-14 18:23:25
sum
图解redis的持久化存储机制RDB和AOF的原理和优缺点

本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件，恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘，实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点，帮助读者更好地理解redis的持久化存储策略。 ... [详细]

蜡笔小新 2023-12-13 20:24:11
client
java命令运行

Java在运行已编译完成的类时，是通过java虚拟机来装载和执行的，java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]

蜡笔小新 2023-12-12 19:26:55
client
【牛客网论坛】第6章：Elasticsearch，分布式搜索引擎（Elasticsearch入门）

Elasticsearch1Elasticsearch入门1.1Elasticsearch术语1.1.16.0以前的Elasticsearch术语1.1.26.0以后的Elasti ... [详细]

蜡笔小新 2023-12-12 16:53:17
client
解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法

本文介绍了解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法，包括检查location配置是否正确、pass_proxy是否需要加“/”等。同时，还介绍了修改nginx的error.log日志级别为debug，以便查看详细日志信息。 ... [详细]

蜡笔小新 2023-12-12 13:19:04
sum
Oracle优化新常态的五大禁止及其性能隐患

本文介绍了Oracle优化新常态中的五大禁止措施，包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB，并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况，并提出了解决方案。 ... [详细]

蜡笔小新 2023-12-12 12:55:55
go
ejava,刘聪dejava

本文目录一览：1、什么是Java？2、java ... [详细]

蜡笔小新 2023-12-09 09:28:18
go
【译】发送表单数据

这是原文链接：sendingformdata许多情况下，我们使用表单发送数据到服务器。服务器处理数据并返回响应给用户。这看起来很简单，但是 ... [详细]

蜡笔小新 2023-12-14 16:19:10
client
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
client
Web学习历程记录（七）——Tomcat基本概念和配置

本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念，以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器，包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实，适合初学者了解Tomcat的基础知识。 ... [详细]

蜡笔小新 2023-12-13 17:08:24
client
集成电路企业跨隔离网数据交换的安全性及解决方案

集成电路企业在进行跨隔离网数据交换时面临着安全性问题，传统的数据交换方式存在安全性堪忧、效率低下等问题。本文以《Ftrans跨网文件安全交换系统》为例，介绍了如何通过丰富的审批流程来满足企业的合规要求，保障数据交换的安全性。 ... [详细]

蜡笔小新 2023-12-12 11:59:54
client
在虚拟服务器上安装oracle 10g客户端的问题及解决方法

本文讨论了在VMWARE5.1的虚拟服务器Windows Server 2008R2上安装oracle 10g客户端时出现的问题，并提供了解决方法。错误日志显示了异常访问违例，通过分析日志中的问题帧，找到了解决问题的线索。文章详细介绍了解决方法，帮助读者顺利安装oracle 10g客户端。 ... [详细]

蜡笔小新 2023-12-11 13:08:10
search
利用ASP.NET MVC和Bootstrap快速搭建响应式个人博客站(一)

1.0为什么要做这个博客站？　　在工作学习中，经常要搜索查找各种各样的资料，每次找到相关资料后都会顺手添加到浏览器书签中，时间一长，书签也就满了。而且下次再点击这个书签时，可能就会忘记当时为什么要添加这个书签了，更有可能书签连接已经无效。这样一来，也就不方便 ... [详细]

蜡笔小新 2023-10-15 13:22:17

秋秋传奇哦_729

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章