当前位置: 开发笔记 > 编程语言 > 正文

Elasticsearch的配置学习笔记

作者：苏汉文健康_706 | 来源：互联网 | 2023-09-23 11:40

文朱季谦Elasticsearch是一个基于Lucene的搜索服务器。它提供一个分布式多用户能力的全文搜索引擎，基于RESTfulweb接口，Elasticsearch是用Java

文/朱季谦

Elasticsearch是一个基于Lucene的搜索服务器。它提供一个分布式多用户能力的全文搜索引擎，基于RESTful web接口，Elasticsearch是用Java语言开发的。

关于Elasticsearch系列笔记，主要从Elasticsearch的配置、核心组件、架构设计、使用语法这四个方面来记录学习；

本学习总结主要依赖《Elasticsearch实战与原理解析》一书的读书笔记，我把自己阅读过程当中整理的读书笔记做成了一张脑图，上传至了我的GitHub。

Elasticsearch的配置

Elasticsearch的配置比较重要有三个，分别是elasticsearch.yml，jvm.options，log4j2.properties，这些配置文件都默认放在/config/目录下。

elasticsearch.yml：用于配置Elasticsearch基本信息，主要包括集群、节点、ip、端口等；

jvm.options：配置Elasticsearch依赖的JVM信息，ES是Java写的，当然需要考虑堆大小的分配；

log4j2.properties：用于配置Elasticsearch日志记录中的各个属性；

elasticsearch.yml关键参数

#集群名称，默认是elasticsearch，用于区分同一网段下的不同集群 cluster.name: my-application #集群当中的节点名称，用于区分同一个集群下的不同节点 node.name: node-1 #存储index索引数据的路径，可以存储到多个路径，例如：path.data: /temp/data1，/temp/data2，/temp/data3， path.data: /temp/data #日志文件的存储路径 path.logs: /temp/logs #当前节点的ip地址，允许通过外部服务器访问本地ES服务: network.host: 0.0.0.0 #该节点有机会成为master节点 node.master: true #该节点能够存储数据 node.data: true #######################设置head插件能够访问es########### #设置可以跨域，默认为false http.cors.enabled: true #支持所有域名访问 http.cors.allow-origin: "*" #跨域允许设置的头信息，默认为X-Requested-With,Content-Type,Content-Length http.cors.allow-headers : X-Requested-With,Content-Type,Content-Length #端口 http.port: 9250 #设置集群主机列表，每个值应采用host：port，可实现主动发起ping集群主机信息 discovery.zen.ping.unicast.hosts: ["host1","host2","host3"] #该参数表示只有足够的master候选节点时，才可以选举出一个master，该参数的值为master候选节点数量/2+1 #例如：如果有3个master候选节点，100个数据节点。则quorum=3/2+1=2 discovery.zen.minimum_master_nodes: 2 #表示设置了节点与节点之间连接ping命令执行的超时时长。 discovery.zen.fd.ping_timeout: 100s discovery.zen.ping.timeout: 100s #主动关闭多播模式 discovery.zen.ping.multicast.enabled: false #默认90%，超过阈值后，所有索引都被修改为只读不可写状态 cluster.routing.allocation.disk.watermark.flood_stage: 90% #默认90%，超过阈值后，索引的分片将不会被分配到该主机 cluster.routing.allocation.disk.watermark.high: 90%

elasticsearch.yml配置当中，discovery.zen相关的参数设置，主要是用来实现集群当中节点自动发现机制的，存在多播模式与单播模式。

多播模式：对某一个网络上的所有主机发送数据包。

单播模式：对特定的主机进行数据传送。

在Elasticsearch中，发现机制默认被配置为使用单播模式，以防止节点无意中加入集群。

jvm.options配置信息

Elasticsearch官方中文文档上介绍道：“你几乎可以不去调整 Java 虚拟机 (JVM) 参数，如何非要做的话，你最有可能去修改heap size。”

也就是说，这个配置文件里，一般只需要关注堆大小的设置即可，因为每一个运行环境服务器都不一样，可以根据服务器具体情况来调整jvm.options里的堆大小。

#最小堆的值 -Xms1024m #最大堆的值 -Xmx1024m #表示老年代占用75%时就会触发垃圾回收 -XX:CMSInitiatingOccupancyFraction=75

设置规则一般如下：

最小堆Xms与最大堆Xmx设置值相同，避免当堆大小不够时再进行动态调整出现不确定因素；

Elasticsearch性能调优与JVM性能调优类似，都是通过JVM参数来进行调整优化，至于如何能有效调整，后续我若在实践过程中涉及过，会补充这块的内容。

log4j2.properties配置信息

该配置是Elasticsearch日志记录中的各个属性设置，包括日志保存设置、日志保留天数、慢日志、日志滚动等。

比较需要关注的一条参数是：

#将日志滚动到路径后的数据里 appender.rolling.filePattern = ${sys:es.logs.base_path}${sys:file.separator}${sys:es.logs.cluster_name}-%d{yyyy-MM-dd}-%i.log.gz #使用基于时间的滚动策略 appender.rolling.policies.time.type = TimeBasedTriggeringPolicy # 每天滚动一次日志 appender.rolling.policies.time.interval = 1 # 日志文件每达到 1GB 大小进行一次滚动 appender.rolling.policies.size.size = 1GB

所谓滚动日志，就是将当天的日志整理成一个以某种各种命名（例如时间）的文件，可存储历史的日志文件记录。我们在服务器的log目录下，经常看到类似的历史日志被打包成压缩包形式，这类被打包成压缩包的历史日志文件，即为回滚日志。我们经常在mysql里听到过日志回滚，其实，回滚的，即是这些原来被回滚存放在log目录下的日志文件。

推荐阅读

filter
58同城的Elasticsearch应用与平台构建实践

本文由58同城高级架构师于伯伟分享，由陈树昌编辑整理，内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用，特别是在58同城的实施案例，包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]

蜡笔小新 2024-12-11 19:31:21
web
全面解析运维监控：白盒与黑盒监控及四大黄金指标

本文深入探讨了白盒和黑盒监控的概念，以及它们在系统监控中的应用。通过详细分析基础监控和业务监控的不同采集方法，结合四个黄金指标的解读，帮助读者更好地理解和实施有效的监控策略。 ... [详细]

蜡笔小新 2024-12-22 14:02:29
char
最强阿里及大厂350道面试大全：框架+数据库+并发+开源+微服务

前言无论是对于刚入行工作还是已经工作几年的java开发者来说，面试求职始终是你需要直面的一件事情。首先梳理自己的知识体系，针对性准备，会有事半功倍的效果。我们往往会把重点放在技术上 ... [详细]

蜡笔小新 2024-12-18 15:33:00
js
Web与游戏开发的主要差异

本文探讨了Web开发与游戏开发之间的主要区别，旨在帮助开发者更好地理解两种开发领域的特性和需求。文章基于作者的实际经验和网络资料整理而成。 ... [详细]

蜡笔小新 2024-12-18 08:26:30
spring
收割机|篇幅_国内最牛逼的笔记，不接受反驳！！

收割机|篇幅_国内最牛逼的笔记，不接受反驳！！ ... [详细]

蜡笔小新 2024-12-14 10:20:42
timestamp
构建高性能Feed流系统的设计指南

随着移动互联网的发展，Feed流系统成为了众多社交应用的核心组成部分。本文将深入探讨如何设计一个高效、稳定的Feed流系统，涵盖从基础架构到高级特性的各个方面。 ... [详细]

蜡笔小新 2024-11-26 12:55:53
spring
ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES

一、认识ElasticSearch是一个基于Lucene的开源搜索引擎，通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索，分析系统&# ... [详细]

蜡笔小新 2023-12-09 10:36:06
filter
精通Spring Cloud：从入门到实践的全面指南

Spring Cloud因其强大的功能和灵活性，被誉为开发分布式系统的‘一站式’解决方案。它不仅简化了分布式系统中的常见模式实现，还被广泛应用于企业级生产环境中。本书内容详实，覆盖了从微服务基础到Spring Cloud的高级应用，适合各层次的开发者。 ... [详细]

蜡笔小新 2024-12-16 16:21:23
list
构建Filebeat-Kafka-Logstash-ElasticSearch-Kibana日志收集体系

本文介绍了如何使用Filebeat、Kafka、Logstash、ElasticSearch和Kibana构建一个高效、可扩展的日志收集与分析系统。各组件分别承担不同的职责，确保日志数据能够被有效收集、处理、存储及可视化。 ... [详细]

蜡笔小新 2024-12-08 14:48:22
list
Elasticsearch (ES) 基础概念解析

本文介绍了Elasticsearch (ES)，这是一个基于Java开发的开源全文搜索引擎。ES通过JSON接口提供服务，支持分布式集群管理和索引功能，特别适合大规模数据的快速搜索与分析。 ... [详细]

蜡笔小新 2024-12-06 18:41:45
spring
美团优选推荐系统架构师 L7/L8：算法与工程深度融合

美团优选推荐系统架构师 L7/L8：算法与工程深度融合 ... [详细]

蜡笔小新 2024-11-05 19:10:28
uml
Coursera ML 机器学习

2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]

蜡笔小新 2024-12-22 16:09:09
controller
Java项目分层架构设计与实践

本文探讨了Java项目中应用分层的最佳实践，不仅介绍了常见的三层架构（Controller、Service、DAO），还深入分析了各层的职责划分及优化建议。通过合理的分层设计，可以提高代码的可维护性、扩展性和团队协作效率。 ... [详细]

蜡笔小新 2024-12-22 12:14:24
shell
Nature Microbiology: 人类肠道古菌基因组目录

本研究揭示了人类肠道微生物群落中古细菌的多样性，分析了来自24个国家、农村和城市人群的1,167个非冗余古细菌基因组。研究鉴定了多个新分类群，并探讨了古菌对宿主的适应性及其与社会人口特征的关系。 ... [详细]

蜡笔小新 2024-12-22 12:10:46
spring
利用ASP.NET MVC和Bootstrap快速搭建响应式个人博客站(一)

1.0为什么要做这个博客站？　　在工作学习中，经常要搜索查找各种各样的资料，每次找到相关资料后都会顺手添加到浏览器书签中，时间一长，书签也就满了。而且下次再点击这个书签时，可能就会忘记当时为什么要添加这个书签了，更有可能书签连接已经无效。这样一来，也就不方便 ... [详细]

蜡笔小新 2023-10-15 13:22:17

苏汉文健康_706

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章