教你ELK统一日志系统是如何应用的

作者：郭楠v | 来源：互联网 | 2023-09-04 10:30

收集和分析日志是应用开发中至关重要的一环，互联网大规模、分布式的特性决定了日志的源头越来越分散，产生的速度越来越快，传统的手段和工具显得日益力不从心。在规模化场景下，grep、aw

收集和分析日志是应用开发中至关重要的一环，互联网大规模、分布式的特性决定了日志的源头越来越分散，

产生的速度越来越快，传统的手段和工具显得日益力不从心。在规模化场景下，grep、awk 无法快速发挥作用，我们需要一种高效、灵活的日志分析方式，可以给故障处理，问题定位提供更好的支持。基于全文搜索引擎 Lucene 构建的 ELKstack 平台，是目前比较流行的日志收集方解决方案。

ELK系统的部署按照官方文档操作即可，相关资料也很多，这篇文章更多的关注三个组件的设计和实现，帮助大家了解这个流行的日志收集系统，

ELK统一日志系统

结合Logstash，ElasticSearch和Kibana三个组件，可以搭建一套高效的日志收集和分析系统。

ELK日志系统数据流图

ELK stack支持组件间的灵活组合，提供强大的开箱即用的日志收集和检索功能。

教你ELK统一日志系统是如何应用的

可以看到ELK系统进行日志收集的过程可以分为三个环节：

日志收集和导入ElasticSearch
ElasticSearch进行索引等处理
可视化操作，查询等

Logstash可以结合Redis或者kafka等收集应用服务器产生的日志，经过简单的过滤等操作后发送到ElasticSearch，ElasticSearch进行相关的索引处理，最后在Kibana进行相关的可视化操作。

Logstash进行日志采集

Logstash 是一种功能强大的信息采集工具，类似于同样用于日志收集的 Flume。

Logstash通过配置文件规定 Logstash 如何处理各种类型的事件流，一般包含 input、filter、output 三个部分。

Logstash 为各个部分提供相应的插件，通过 input、filter、output 三类插件完成各种处理和转换，

另外 codec 类的插件可以放在 input 和 output 部分通过简单编码来简化处理过程。

1.Logstash架构

Logstash使用Jruby语言编写，对于使用者来讲，Logstash本身是基于命令行界面，面向任务处理的。

Logstash的软件架构是一种带有“管道-过滤器”风格的插件式架构，作为一个开源软件，Logstash遵循

Apache 2.0

进行开源，第三方社区为其贡献了大量插件。

教你ELK统一日志系统是如何应用的

这张数据流图来自官方社区，可以看到Logstash的运行时数据处理会经历三个阶段：

输入阶段接受不同来源的数据流入，可以配置codec插件进行简单的处理。
过滤阶段对流入数据进行过滤等操作，传递给output，其中“输入”与“输出”是必须有的，“过滤”阶段是可选的。
输出阶段将数据传递到消息队列，文件系统等进行进一步处理，在ELK的日志系统中，输出到ElasticSearch索引中。

三个阶段的处理任务是异步的，不存在跨阶段任务执行与同一个线程中的情况。

2.Logstash如何应用

Logstash可以通过指定配置文件直接启动，下面是一份典型的配置示例：

# 读取access.log日志并输出到控制台
input {

filex {

path => ["/Users/bingyue/Work/workspace/access.log"]

}

output {

stdout {

}

ElasticSearch的设计和应用

ElasticSearch是一个开源搜索服务器项目，2010年2月发布至今，该项目已发展成为搜索和数据分析解决方案领域的主要一员。ES的实现和应用包括非常多的内容，这里我们只简单了解，从整体架构入手，做到对ES有一个初步的认识。

1.ElasticSearch架构

ElasticSearch基于Apache Lucene实现，Lucene是一个成熟的、高性能并且可扩展的搜索引擎包， ElasticSearch在Lucene之上封装了索引，查询，以及分布式相关的接口。

2.Elasticsearch概念

节点（Node)和集群（Cluster）

节点是集群中的一个 Elasticearch 实例。集群是一组拥有共同的 cluster name 的节点。其中一个节点就是一个 ES 进程，多个节点组成一个集群。一般每个节点都运行在不同的操作系统上，配置好集群相关参数后 ES 会自动组成集群。集群内部通过 ES 的选主算法选出主节点，而集群外部则是可以通过任何节点进行操作，无主从节点之分，对外表现对等，去中心化，有利于客户端编程。

索引 Index

索引在ES中索引有两层含义，作为动词，它指的是把一个文档保存到 ES 中的过程，索引一个文档后，我们就可以使用 ES 搜索到这个文档；作为名词，它是指保存文档的地方，相当于关系数据库中的database概念，一个集群中可以包含多个索引。

分片 shard

ES 是一个分布式系统，它保存索引时会选择适合的“主分片”（Primary Shard），把索引保存到其中（我们可以把分片理解为一块物理存储区域）。分片的分法是固定的，而且是安装时候就必须要决定好的（默认是 5），后面就不能改变了。

既然有主分片，那肯定是有“从”分片的，在 ES 里称之为“副本分片”（Replica Shard）。副本分片主要有两个作用：高可用：某分片节点挂了的话可走其他副本分片节点，节点恢复后上面的分片数据可通过其他节点恢复负载均衡：ES 会自动根据负载情况控制搜索路由，副本分片可以将负载均摊

RESTful支持

ES支持RESTful访问，并且 ES 的 HTTP 接口不只是可以进行业务操作（索引/搜索），还可以进行一些配置等。

下面介绍几个很常用的接口：

/_cat/nodes?v：查集群状态 /_cat/shards?v：查看分片状态 /${index}/${type}/_search：搜索

我们也可以直接在所有索引所有类型上进行搜索：/_search。

除了上面这些，ES官方社区还给出了一些关键术语解释：

document 文档

一个文档就是一个保存在 es 中的 JSON 文本，可以把它理解为关系型数据库表中的一行。每个文档都是保存在索引中的，拥有一种类型和 id。一个文档是一个 JSON 对象（一些语言中的 hash / hashmap / associative array）包含了 0 或多个字段（键值对）。原始的 JSON 文本在索引后将被保存在 _source 字段里，搜索完成后返回值中默认是包含该字段的。

Id 是用于标识文档的，一个文档的索引/类型/id 必须是唯一的。文档 id 是自动生成的（如果不指定）。

field 字段

一个文档包含了若干字段，或称之为键值对。字段的值可以是简单（标量）值（例如字符串、整型、日期），也可以是嵌套结构，例如数组或对象。一个字段类似于关系型数据库表中的一列。每个字段的映射都有一个字段类型（不要和文档类型搞混了），它描述了这个字段可以保存的值类型，例如整型、字符串、对象。映射还可以让我们定义一个字段的值如何进行分析。

mapping 映射

一个映射类似于关系型数据库中的模式定义。每个索引都存在一个映射，它定义了该索引中的每一种类型，以及索引相关的配置。映射可以显示定义，或者在文档被索引时自动创建。

3.ElasticSearch的应用场景

ElasticSearch的应用场景主要发挥其强大的全文搜索功能，因为良好的分布式支持，一些公司也会使用ES作为文档型数据库，类似MongoDB等的应用。

全文搜索应用最为广泛，ES加上分词插件、拼音插件什么的可以做成强大的全文搜索引擎
数据库存储主要关注ES的强大统计分析汇总能力，再加上分布式扩展能力
在线统计分析引擎，日志系统结合logstash等组件，可以实时动态分析数据

Kibana进行可视化分析

Kibana应用在ElasticSearch之上，提供可视化的数据查询和分析等功能，主要的版本有Kibana 3和Kibana 4，两者在设计上区别较大，这里主要介绍k4的应用。

要使用Kibana，就得告诉它想要探索的 Elasticsearch 索引是那些，需要配置一个或者多个索引模式。默认情况下，Kibana 认为你要访问的是通过 Logstash 导入 Elasticsearch 的数据，这时候使用默认的 logstash-* 作为index pattern。 Kibana 数据展示需要一个包含了时间戳的索引字段，用来做基于时间的处理，如果是由logstash导入的日志，使用默认的@timestamp即可。

教你ELK统一日志系统是如何应用的

连接到Elasticsearch以后，就可以使用kibana进行数据的分析。

kibana的面板支持以下的功能：

在 Discover 页搜索和浏览数据
在 Visualize 页转换数据成图表
在 Dashboard 页创建定制自己的仪表板

1.搜索和浏览数据

Discover 标签页用于交互式探索数据。可以访问到匹配得上选择的索引模式的每个索引的每条记录。可以提交搜索请求，过滤搜索结果，然后查看文档数据。还可以看到匹配搜索请求的文档总数，获取字段值的统计情况。如果索引模式配置了时间字段，文档的时序分布情况会在页面顶部以柱状图的形式展示出来。

kibana支持Lucene格式的检索方式。包括：

（1）简单的文本搜索，直接输入文本字符串。

比如，如果在搜索网站服务器日志，可以输入exception来搜索各字段中的exception单词。

（2）搜索特定字段中的值，

搜索特定字段中的值，则在值前加上字段名。比如，可以输入 status:200 来限制搜索，要搜索一个值的范围，可以用范围查询语法，

（3）使用连接条件进行复杂搜索

要指定更复杂的搜索标准，可以用布尔操作符AND, OR和 NOT 。

2.数据转换成图表

Visualize 标签页用来设计可视化。支持各种图表进行展示。

数据源可以选择新建或者读取一个已保存的搜索。搜索是和一个或者一系列索引相关联的。如果选择了在一个配置了多个索引的系统上开始新搜索，从可视化编辑器的下拉菜单里选择一个索引模式。

3.自定义仪表盘

Kibana dashboard 能支持***排列一组已保存的视图。然后可以保存这个仪表板，用来分享或者重载。

（1）创建新的仪表盘

第一次点击 Dashboard 标签的时候，Kibana 会显示一个空白的仪表板。通过添加可视化的方式来构建仪表板。

要添加视图到仪表板上，点击工具栏面板上的 Add。从列表中选择一个已保存的视图。可以在 Visualization Filter 里输入字符串来过滤想要找的视图。你选择的这个视图会出现在仪表板上的一个容器(container)里。

大数据交流群：724693112 欢迎大家前来交流讨论学习和下载学习资源！

（2）修改仪表盘信息

仪表板里的可视化都存在可以调整大小的容器里，点击容器右上角的 Edit 按钮在 Visualize 页打开可视化编辑。

以上是关于ELK组件的介绍，在具体的日志系统搭建中，有很多细节需要注意。另外随着容器化部署的兴起，日志收集的方式也变的更多样化，后面会分享下关于ELK结合容器内日志收集的方案。

推荐阅读

ip
搞懂 ELK 并不是一件特别难的事

点击下方“民工哥技术之路”，选择“设为星标”回复“1024”获取独家整理的学习资料！本篇文章主要介绍ELK的一些框架组成，原理和实践&#x ... [详细]

蜡笔小新 2023-10-11 15:13:24
ip
ELK stack 学习记录

ELK日志分析平台学习记录首先ELK主要指elasticsearch、logstash和kibana，三个开源软件组合而成的一套日志平台解决方案。可以将平时收集到的日志，通过前台展 ... [详细]

蜡笔小新 2023-10-13 09:12:39
java
NET Core微服务之路：简单谈谈对ELK，Splunk，Exceptionless统一日志收集中心的心得体会

前言日志，一直以来都是开发人员和运维人员最关心的问题。开发人员可通过日志记录来协助问题定位，运维人员可通过日志发现系统隐 ... [详细]

蜡笔小新 2023-10-12 13:09:51
java
优秀到卓越就差比他更快搭建elk集群架构上篇

工作原理开源分布式搜索引擎，特点有：分布式，零配置，自动发现，索引自动分片，索引副本机制 ... [详细]

蜡笔小新 2023-10-10 19:47:17
ip
用elastic stack来分析下你的redis slowlog

redis是目前最流行的NoSQL内存数据库，然而如果在使用过程中出现滥用、乱用的情况，很容易发生性能问题，此时我们就要去关注慢查询日志& ... [详细]

蜡笔小新 2023-10-10 17:03:40
ip
深入理解Awk文本处理工具

Awk是一款功能强大的文本分析与处理工具，尤其在数据解析和报告生成方面表现突出。它通过读取由换行符分隔的记录，并按照指定的字段分隔符来划分和处理这些记录，从而实现复杂的数据操作。 ... [详细]

蜡笔小新 2024-11-23 09:44:24
ip
为何Compose与Swarm之后仍有Kubernetes的诞生？

探讨在已有Compose和Swarm的情况下，Kubernetes是如何以其独特的设计理念和技术优势脱颖而出，成为容器编排领域的领航者。 ... [详细]

蜡笔小新 2024-11-22 09:26:11
list
Redis：缓存与内存数据库详解

本文介绍了数据库的基本分类，重点探讨了关系型与非关系型数据库的区别，并详细解析了Redis作为非关系型数据库的特点、工作模式、优点及持久化机制。 ... [详细]

蜡笔小新 2024-11-18 14:16:11
ip
将日志从远程服务器拉入Elasticsearch

简短的问题是：是否可以从远程服务器中提取日志（在日志文件中）并将其提取到 ... [详细]

蜡笔小新 2023-10-13 11:23:51
java
Flume 数据采集组件

目录1、数据收集工具系统产生背景2、专业的数据收集工具2.1、Chukwa2.2、Scribe2.3、Fluentd2.4、Logstash2.5、ApacheFlu ... [详细]

蜡笔小新 2023-10-12 13:31:33
java
ELK+filebeat安装部署监控springboot日志

ELK服务器端部署1.安装dockercompose，略2.配置docker-compose.ymlcdrootelkvidocker-compose.ymlversion:&am ... [详细]

蜡笔小新 2023-10-11 20:43:29
java
ELK 日志系统入门及通过 Docker 部署

1.ELK系统是什么ELK是一套日志中心解决方案，其三个字母分别表示：Elasticsearch：负责日志存储及检索Logstash&#x ... [详细]

蜡笔小新 2023-10-10 18:48:38
java
Rancher 部署 logstash

RancherOnlogstash一、下载logstash镜像二、创建挂载目录与映射配置文件2.1创建配置文件2.2配置启动命令2.3映射配置文件概述：logstas ... [详细]

蜡笔小新 2023-10-10 16:58:56
list
MyBatis中SQL查询参数传递方法详解

本文详细介绍了在MyBatis框架中如何通过#和$两种方式来传递SQL查询参数。使用#方式可以提高执行效率，而使用$则有助于在复杂SQL语句中更好地查看日志。此外，文章还探讨了不同场景下的参数传递方法，包括实体对象、基本数据类型以及混合参数的使用。 ... [详细]

蜡笔小新 2024-11-24 15:36:41
list
Logstash安装配置

阅读此文请先阅读上文：[大数据]-Elasticsearch5.3.1IK分词，同义词联想搜索设置，前面介绍了ES，Kiba ... [详细]

蜡笔小新 2024-10-19 17:54:56

郭楠v

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章